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СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ 


А, В, С, о. — постоянные величины; факторы и нх градации в 
дисперсиониом комплексе; случайные события 
А — условная средняя, иулевой класс, где А=0 
а, Б, с, ... — числеиность групп (градаций) факторов 4, В, С, ... 
в дисперсионных комплексах; параметры, опреде- 
ляющие соотношение между аргумеитом и функ- 
цией; варианты в клетках четырехпольной таблицы 
а — отклонения вариант от условной средней, нулевого 
класса 
Аѕ — коэффнциент аснмметрии ряда распределения 
Бъ — условный момеит п-го поридка 
Бух и бу — коэффициенты регрессии У/Х и Х/У 
Сѕ — показатель точиости оценки средней величины 
Со — коэффициенты вариации 
Р — сумма квадратов отклонений вариант от их сред- 
иих (девиата) 
4 — разность между сравниваемыми величинами 
а — средняя разиость между попарио сравииваемыми 
вариантами 
Ех — показатель (коэффициент) эксцесса распределения 
Е — критерий соответствия (согласия) Р. Фишера 
{ — эмпирические частоты вариант в даниой совокуп- 
ности 
 — вычислениые или ожидаемые частоты вариаит 
у — частоты вариаит в клетках корреляциоиной таб- 
ЛиЦЫ 
|. — первая функция иормального распределения 
Н — величнна, используемая в дисперсионном анализе; 
критерий Краскелла — Уоллиса 
Н д — символ альтернативной гипотезы 
Но — символ иулевой гипотезы 
н — показатель силы влияния факторов на результа- 
тивный признак 
і — порядковый иомер варианты 
Ј — критернй соответствия Ястремского 
К — бииомиальиый коэффициеит; коэффициеит взаим- 
ной сопряжениости между качественными приз- 
иаками 
Ё — число степеней свободы 
Ит — символ, обозначающий границы вариации признака 
Ме — медиаиа 
Мо — мода 
т — начальные момеиты распределения; классы бино- 
миального ряда; число случаев, благоприятствую- 
щих иаступлеиию ожидаемого события; абсолют- 
ная численность альтернатив, обладающих дан- 
ным (плюсовым) призиаком; доза вещества, вы- 
зывающая эффект у 100% подопытных особей 
М — объем генеральиой совокупиости; объем дисперси- 
оииого комплекса; число классов (групп) вариа- 
циоиного ряда; общая сумма сопоставляемых ря- 
дов 
п — объем выборки; число членов ряда регрессии; чис- 
лениость вариаит в отдельных градациях диспер- 
сиоиного комплекса 
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ті — варианты в градациях анализируемого комплекса 

Я — усредненная величина входящих в выборку число- 
вых показателей 

Ф — коэффициент ассоциации Юла 

Р — вероятиость события; доверительная вероятность 

р — доля вариант, обладающих данным признаком (+) 

4 — доля ыы не обладающих данным призна- 
ком (— 

К — раиг, или порядковый номер варианты в ранжи- 
рованном ряду; размах вариации; коэффициент 
корреляции знаков 

г — коэффициент корреляцин 

5х — среднее квадратическое отклонение 

5:2 — выборочная дисперсия (варианса) 
5; — ошибка выборочной средией 
бух И 5ху — ошибки регрессии У по Хи Хпо У 
— критерий Уилкоксона для независимых выборок 
г — показатель трансгрессин рядов распределения 
+ — нормированное отклоненне; критерий Стьюдеита 
— критерий Уилкоксона (Манна — Уитни) для со- 
пряженных выборок 
— кригерий Ван-дер-Вардена 
_ — средняя арифметическая (общая) 
ХА И Хв — средние арифметические из суммы членов градации 
= А и В дисперсионного комплекса 
26 — средняя геометрическая 
в — средняя гармоническая 
2 — групповая средняя в однофакторных дисперсион- 
_ ных комплексах 
2а — средияя квадратическая 
_ 29 — средняя кубическая 
у и ух — частные или групповые средние Х по Уи Упо Х 
х — средняя из суммы групповых средних 
Х, У, 2, .. — переменные величины; признаки 
х, у, 2, „. — числовые значения признаков, варианты или даты 
(по терминологии Р. Фишера) 
2 — преобразованный коэффициент корреляции (по 
Фишеру); критерий зиаков 


а (альфа) — уровень значимости оценок 
В (бета) — критерий достоверности Блекмана 
ү (гамма) — показатель линейиости связи 
А (дельта) — предельная величина ошибки выборочных показа- 
телей; величина, определяющая границы довери- 
тельного интервала 
т (эта) — центральные моменты; корреляционное отношение 
А (ламбда) — величина классового интервала 
и (ми, мю) — генеральная средняя; математнческое ожндание 
у (ню) — число ограннченнй свободы вариацни 
о (ро) — генеральный коэффициент корреляции 
Я (сигма прописная) -– знак суммирования 
с (сигма строчная) — среднее квадратическое отклонение (генеральное) 
0? — генеральная дисперсия (варианса) 
Фф (фи) — преобразованная доля вариант (по Фишеру) 
ф? — показатель взаимной сопряженности между груп 


памн варьирующих признаков 
2 (хи-квадрат) — критерий соответствия Пирсона 
ар (пси) — величина, применяемая в формуле Х-критерия Ван- 
дер-Вардена 


ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ ! 


} 


о Настоящее (четвертое) издание «Биометрии» переработано и 
дополнено новыми данными. Пересмотру подвергнута каждая 
глава; особенно заметные изменения внесены в гл. І. Значитель- 
ные поправки и дополнения сделаны в главах, посвященных дис- 
персионному и корреляционно-регрессионному анализу. Изменен 
и самый порядок расположения глав. Все это положительно ска- 
залось на системе изложения материала, заимствованного из раз- 
ных разделов биологии, медицины, антропологии, педагогики, ос- 
нов сельскохозяйственных наук и других смежных отраслей зна- 
НИЯ. 

При подготовке книги были учтены многочисленные отзывы, 
критические замечания и пожелания читателей, которые автор 
получил после выхода в свет третьего издания (1980). 

Автор выражает всем этим лицам свою признательность. Ав- 
тор также благодарен А. А. Кузьмину (г. Архангельск) за боль- 
шую помощь при подготовке настоящего издания, профессору 
Н. Б. Вассоевичу (МГУ) за оказанную им помощь в работе, а 
также О. А. Лакиной (супруге автора), принимавшей участие в 
работе по совершенствованию рукописи. 

Автор 


ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ 


В творческой деятельности биолога, в какой бы области он 
ни работал, большое место занимают вопросы статистической об- 
работки опытных данных, сравнительная оценка результатов на- 
блюдений. Поэтому вполне понятен тот большой интерес, кото- 
рый проявляют биологи самых различных специальностей к 
справочным пособиям и руководствам по биометрии. 

В нашей стране и за рубежом издан целый ряд таких посо- 
бий, и, несмотря на то что многие из них доступны лишь сравни- 
тельно узкому кругу специалистов, все издания быстро разош- 
лись. Спрос на учебные пособия и справочную литературу по био- 
метрии в нашей стране необычайно велик. Особенно сильно ощу- 
щается недостаток в общедоступных руководствах по этому пред- 


1 В связи с кончнной автора во время подготовкн учебного пособия к пе» 
реизданию доработка рукописи и научное редактирование осуществлены канд. 
биол. наук В. Е. Дерябнным, им же написано послесловие к книге. 
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мету; в них очень нуждаются широкие круги биологов и специа- 
листов смежных с биологией дисциплин. 

Настоящее руководство рассчитано главным образом на сту- 
дентов и аспирантов, изучающих этот предмет, а также на препо- 
давателей и научных работников, которые не имеют специаль- 
ной математической подготовки и нуждаются в таком руководст- 
ве. Полезные сведения найдут в этой книге и учителя средних 
школ, занимающиеся проведением опытов на пришкольных уча- 
стках, в лабораториях и в производственных условиях сельско- 
хозяйственных предприятий. 

От приступающих к изучению биометрии требуются знания 
математики хотя бы в объеме программы средней общеобразова- 
тельной школы. 

Вычислительная работа значительно облегчается при пользо- 
вании математическими таблицами, особенно таблицами для из- 
влечения квадратных корней и возведения в квадрат целых и 
дробных чисел; весьма удобны «Пятизначные таблицы» Е. Прже- 
вальского, «Математические таблицы» П. П. Андреева (1958) и 
«Таблицы умножения» О. Рурк (1949, 1965). Можно воспользо- 
ваться и другими пособиями, в частности широко известными 
«Таблицами Барлоу» (1965). Специальные статистические таб- 
лицы, необходимые для практической работы, помещены в При- 
ложениях. 

При написании учебного пособия автор использовал различ- 
ные литературные источники, а также собственный эксперимен- 
тальный материал, собранный преимущественно в Сухумском 
питомнике обезьян. 

Наряду с описанием методики вычисления суммарных биомет- · 
рических показателей в книге рассматриваются и вопросы теоре- 
тического характера, даются обоснования некоторых наиболее 
важных формул. Примеры и графики иллюстрируют отдельные 
положения курса. Такое построение учебного пособия облегчает 
усвоение предмета и позволяет использовать биометрические ме- 
тоды не слепо, а осмысленно, с пониманием конструктивных осо- 
бенностей различных математических формул и уравнений. 

При подготовке рукописи автор учел полезные советы проф. 
М. Ф. Нестурха; большую помощь в работе оказали рецензенты 
проф. В. В. Алпатов и канд, биол. наук Ю. С. Куршакова и 
В. П. Чтецов. Автор благодарен также и коллективу кафедры 
антропологии МГУ (зав. кафедрой — проф. Я. Я. Рогинский), 
который рекомендовал рукопись к печати. 


Специфика биометрии, ее место в системе биологических на- 
ук. С формальной точки зрения биометрия представляет совокуп- 
ность математических методов, применяемых в биологии и заим-. 
ствованных главным образом из области математической статис- 
тики и теории вероятностей. Наиболее тесно биометрия связана с 
математической статистикой, выводами которой она преимущест- 
венно пользуется, но и биометрия влияет на развитие матема- 
тической статистики. Взаимодействуя между собой, они вза- 
имно обогащают друг друга. Однако отождествлять биомет- 
рию с математической статистикой и теорией вероятностей 
нельзя. 

Биометрия имеет свою специфику, свои отличительные черты 
и занимает определенное место в системе биологических наук. 
Современная биометрия — это раздел биологии, содержаиием 
которого является планирование наблюдений и статистическая 
обработка их результатов; математическая статистика и теория 
вероятностей — разделы математики, теоретические, фундамен- 
тальные науки, рассматривающие массовые явления безотноси- 
тельно к специфике составляющих их элементов. 

Теория вероятностей исследует законы, действующие в сфере 
массовых событий и случайных величин, а математическая ста- 
тистика занимается разработкой выборочного метода, вопросами 
вероятностной оценки статистических гипотез. Биометрия — при- 
кладная наука, исследующая конкретные биологические объек- 
ты с применением математических методов!. Биометрия воз- 
никла из потребностей биологии. В пограничных областях меж- 
ду биологией и математикой сложились и другие направления 
математической биологии. Каждое направление имеет свои за- 
дачи и применительно к ним использует соответствующие ма- 
тематические методы. Общим для всех направлеиий математи- 
ческой биологии является дедуктивный подход к решению кон- 
кретных задач, когда на первое место выдвигаются математи- 
ческие модели с последующей проверкой их опытом. Биомет- 
рия же опирается преимущественно на индуктивный метод, 


мин «вариациоиная статистика» (от лат. үагіайо — изменеиие, колебаиие и 
5{а{из — состояиие, положение вещей) понимают как статистическую обра- 
ботку результатов измерений. Оба термииа недостаточно точны. Отсюда по- 
пыткн заменить их термином «биологическая статистика» (А. В. Леонтович, 
1909; П. Ф. Рокицкий, 1973), который также ие лишен недостатков. 

Учитывая отсутствие общепринятого названия предмета, Ю. Л. Помор- 
ский (1935) пришел к выводу, что из всех предложенных терминов наиболее 
удачиым следует считать термин «биометрия», как наиболее четко отража- 
ющий содержание этого предмета. Следуя этому выводу, автор предпочита- 
ет пользоваться первоначальным термином «биометрия», как более кратким и 
удобным в обращении, применяя его в том смысле, который ои приобрел после 
классических работ Р. Фишера. 

1 Здесь и в дальнейшем слово «объект» обозиачает то, что изучается или 
может быть изучено, на что направлено внимание исследователя, 
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отправляясь от конкретных фактов, которые она анализирует с 
помощью математических методов. 

Характерной особенностью биометрии является также тс, что 
ее методы применяют при анализе не отдельных фактов, а их со- 
вокупностей, т. е. явлений массового характера, в сфере которых 
обнаруживаются закономерности, не свойственные единичным 
наблюдениям. 

Значение биометрии в исследовательской работе и профессио- 
нальной подготовке специалистов биологического профиля. Свя- 
зи современной биологии с математикой многосторонни, они все 
более расширяются и углубляются. В настоящее время трудно 
указать область знания, в которой не применялись бы математи- 
ческие методы. Даже в такой, казалось бы, очень далекой от ма- 
тематики области, как анатомия человека, не обходятся без при- 
менения биометрии. Примером тому может служить работа Е. М. 
Маргорина, изучавшего возрастную изменчивость органов у Че- 
ловека. Он писал: «В идеале для определения возрастных разли- 
чий надо было бы изучать один и тот же орган в его индивиду- 
альном развитии, т. е. у одного и того же человека... Но практи- 
чески это ограничено пределами анатомии, изучаемой на живом 
организме, да и требует много времени для наблюдений. Поэто- 
му к решению вопроса приходится подходить косвенным путем, 
сравнивая один и тот же орган в разные возрастные периоды у 
разных лиц. Но тогда на сцену выступает новая закономер- 
ность — индивидуальная изменчивость, накладывающая сущест- 
венный отпечаток на весь ход изучения возрастных различий»!. 
Понятно, что в таких случаях достоверные выводы, как считает 
Е. М. Маргорин, можно получить не на 2—6 наблюдениях, а на 
гораздо большем их числе; тут без применения биометрии не 
обойтись. 

Биометрия необходима и при изучении наследуемости и пов- 
торяемости хозяйственно важных признаков, измерении связей 
между ними и во многих других случаях. Применение биометрии 
оказалось полезным во многих областях прикладной биологии. 
Так, благодаря биометрическому анализу массовых антропологи: 
ческих измерений антропологам удалось подойти к довольно точ- 
ному обоснованию принципов раскроя и стандартизации обуви и 
одежды, изготовляемой для массового потребления. Биометри- 
ческие показатели легли в основу количественной оценки физи- 
ческого развития человека, его спортивных и трудовых достиже- 
ний. Несомненно, что значение биометрии для наук, изучающих 
биологические объекты, будет возрастать тем более, чем успеш- 
нее применяются достижения счетно-вычислительной техники. 


1 См.: Маргорин Е. М. Изучеиие возрастиых аиатомических различий в свете 
индивидуальной измеичнвости // Арх, анат., гист, и эмбр, 1960. Т. 39. № 10, 
С. 108, 109, 


Конечно, не всякое исследование опирается на биометрию. В 
биологии с успехом применяют и чисто описательные методы, не 
требующие количественных оценок получаемых результатов. Но 
там, где исследования проводят с использованием счета или ме- 
ры, применение биометрии становится совершенно необходимым. 
В таких случаях пренебрежение методами биометрии или непра- 
вильное их применение приводит к неоправданным затратам тру- 
да и времени, а главное — к мало уредителывым, а нередко и 
ошибочным выводам. 

В качестве примера можно привести одну из попыток опро- 
вергнуть закон расщепления, открытый Г. Менделем. В 1939 г. 
были опубликованы опыты Н. Е. Ермолаевой, из которых якобы 
следовало, что частота встречаемости доминантного признака во 
втором поколении гибридов не совпадает с ожидаемой величиной 
3/4. Отсюда был сделан вывод о несостоятельности упомянутого 
закона Менделя. Заинтересовавшись работой Ермолаевой, акад. 
А. Н. Колмогоров подверг ее данные статистическому анализу и 
пришел к прямо противоположному выводу. В статье, опублико- 
ванной в одном из номеров журнала «Доклады Академии наук 
СССР» (1940), он писал: «Материал этот, вопреки сомнению са- 
мой Н. Е. Ермолаевой, оказывается блестящим подтверждением 
законов Менделя». Ошибка Ермолаевой явилась следствием пре- 
небрежительного отношения к биометрии, недооценки ее роли в 
исследовательской работе. Приведенный пример показывает, во- 
первых, что пренебрежение биометрическими методами при изу- 
чении варьирующих объектов приводит к неубедительным и да- 
же ошибочным выводам, а во-вторых, что неумелое, формальное 
применение биометрии создает лишь видимость строгой научнос- 
ти, а в действительности приносит не пользу, а вред. 

Биометрия — формальная наука. Применение ее к анализу 
изучаемых явлений требует известной осторожности. Недаром, 
по образному выражению Гексли, биометрию сравнивают с 
жерновом, «который всякую засыпку смелет, но ценность помо- 
ла определяется исключительно ценностью засыпанного» !. 

Биометрия призвана вооружать исследователей методами ста- 
тистического анализа, воспитывать у них статистическое мышле- 
ние, раскрывая перед ними диалектику связи между частью и 
целым, причиной и следствием, случайным и необходимым в 
явлениях живой природы. Поистине трудно переоценить значе- 
ние биометрии в подготовке научно-педагогических кадров. 

Этапы истории. Биометрия как относительно самостоятельная 
научная дисциплина сложилась во второй половине ХІХ в. Одна- 
ко ее истоки восходят к более раннему периоду в истории есте- 
ствознания: к тому времени, когда измерения биологических объ- 


1 Константинов П. Н. Основы сельскохозяйственного опытного дела, М., 
1952. С. 206, 
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ектов стали рассматривать как метод научного познания. При- 
шедшее на смену феодализма буржуазное общество нуждалось в 
развитии точных знаний о природе; актуальным для этого време- 
ни стал афоризм Г. Галилея (1564—1642): «Измеряй все изме- 
римое и сделай неизмеримое измеримым». 

В 1614 г. появилась книга Сантарио (1561—1636) «О стати- 
ческой медицине». В 1680 г. вышла в свет книга Борелли (1608— 
1679) «О движении животных». В 1768 г. французский гипполог 
Буржеля издал свой труд «Экстерьер лошади». В этой книге при- 
веден набор измерений, необходимых для определения пригоднос- 
ти лошадей к той или иной службе. Характерно, что в это же 
время, т. е. в ХУІІ столетии, развивается военная антропология, 
опирающаяся на результаты измерения тела мужчин призывного 
возраста в целях отбора пригодных к несению военной службы. 
Основанием для количественной оценки строения тела животных 
и человека служил, очевидно, тот факт, что внешние параметры 
тела животных, а также и строение тела человека находятся в 
определенной связи с их физическими и психическими свойства- 
ми. Чтобы точнее выразить эту связь; визуальную оценку свойств 
тела животных и людей по их внешнему виду (экстерьеру) стали 
дополнять его измерениями. А так как результаты измерений 
варьировали, нужно было исследовать эту изменчивость. В 1718 г. 
в Лондоне вышла в свет книга французского математика 
А. де Муавра (1667—1754) «Учение о случаях», Измерив рост 
у 1375 взрослых женщин и расположив результаты измерений в 
ряд, он обнаружил закономерность, соответствующую известно- 
му в теории вероятностей закону нормального распределения 
(см. гл. ІУ). Возникла необходимость интеграции методов биоло- 
гии с методами теории вероятностей и математической ста- 
тистики, 

Теория вероятностей и математическая статистика возникли в 
середине ХҮП в. независимо друг от друга. Стимулом к обосио- 
ванию теории вероятностей послужило развитие денежных отно- 
шений в буржуазном обществе. Известную роль при этом сыгра- 
ли азартные игры — метание монет, игральных костей, картеж- 
ные игры, — которые оказались простыми моделями, позволив- 
шими заметить закономерность в поведении случайных событий 
массового характера. У истоков теории вероятностей стояли 
французские ученые П. Ферма (1601—1665) и Б. Паскаль (1623— 
1662), а также голландский математик и естествоиспытатель 
Х. Гюйгенс (1629—1696). 

Весомый вклад в становление теории вероятностей внесли 
Я. Бернулли (1654—1705) и А. де Муавр. Однако наиболее суще- 
ственное развитие получила эта теория в трудах таких выдаю- 
щихся математиков, как П. Лаплас (1749—1827), К. Гаусс 
(1777—1855), С. Пуассон (1781—1840), а также П. Л. Чебышев 
(1821—1894) и его петербургская школа, 


И 


Развитие математической статистики связаио с проблемами 
государствоведения. К середине ХУП столетия в экономически 
развитых страиах Европы накопилось такое количество сведений 
о демографии, страховом деле, а также в области торговли, здра- 
воохранения и других отраслях хозяйства, что разбираться в них 
при помощи способов описательной статистики стало почти не- 
возможным. Назрела острая необходимость поиска новых мето- 
дов анализа статистических данных, их теоретического обоснова- 
ния. Задача сводилась к тому, чтобы по части судить о состоянии 
целого, т. е. по выборке делать заключение о всей совокупности 
общественных явлений в целом, полное описание которых стано- 
вилось делом очень трудоемким и дорогим. Разработка теории 
выборочного метода сближала математическую статистику с вы- 
водами теории вероятностей, что явилось важной вехой на пути к 
возникновению биометрии. 

Первым, кто удачно объединил методы антропологии и соци- 
альиой статистики с выводами теории вероятностей и математи- 
ческой статистикн, был бельгийский антрополог и статистик 
А. Кетле (1796—1874). В 1835 г. в Брюсселе вышла книга Кетле 
«О человеке и развитии его способностей или опыт социальной 
физики». Второе издание этой книги появилось в 1869 г. под за- 
главием «Социальиая физика или опыт исследования о развитии 
человеческих способностей»!. На большом фактическом материа- 
ле Кетле впервые показал, что самые различные физические осо- 
бенности человека и даже его поведение подчиняются в общем 
закону распределения вероятностей, описываемому формулой 
Гаусса-Лапласа. В другом труде, «О социальной системе и зако- 
нах, управляющих ею» (1848), Кетле описал человеческое обще- 
ство не как сумму индивидов или сообщество людей, проживаю- 
щих на определенной территории, а как иекую систему, подчи- 
няющуюся строгим законам природы, не зависящим от воли лю- 
дей. Наконец, в труде «Антропология» (1871) Кетле показал, что 
открытые им статистические закономерности распространяются 
не только на человеческое общество, но и на все другие живые 
существа. 

Из работ Кетле следовало, что задача статистики заключает- 
ся не в одном лишь сборе и классификации статистических дан- 
ных, а в их анализе, целью которого должно быть открытие за- 
кономерностей, действующих в сфере массовых явлений. Знание 
этих закономерностей и должно было превратить статистику В 
источник научного познания социальных и биологических явле- 
ний. 

Исследования Кетле явились поворотным пунктом в истории 
статистической науки. Кетле одним из первых убедительно пока- 
зал, что случайности, наблюдаемые в живой природе, вследствие 


1 Эта книга переведеиа иа русский язык в 1911 и 1913 гг, 
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их повторяемости обнаруживают внутреннюю тенденцию, кото- 
рую можно исследовать и описать точными математическими ме- 
тодами. 

А. Кетле заложил основы биометрии. Создание же математи- 
ческого аппарата этой науки принадлежит английской школе 
биометриков ХІХ в., во главе которой стояли Ф. Гальтон (1822— 
1911) иК. Пирсон (1857—1936). Эта школа возникла под влия- 
нием гениальных трудов Ч. Дарвина (1809—1882), совершившего 
переворот в биологической науке. Опровергнув господствующее 
тогда представление о неизменности биологических видов, Дар- 
вин противопоставил ему эволюционное учение, положив в основу 
принцип естественного отбора. Этот принцип базируется на ста- 
тистическом характере причинно-следственных отношений, скла- 
дывающихся в живой природе; он подтверждает гегелевскую 
концепцию о внутренней связи между случайностью и необходи- 
мостью, между причиной и следствием, частью и целым. 

Революция, совершенная Дарвином в биологической науке, 
поставила перед учеными целый ряд больших и неотложных за- 
дач, среди которых на первом плане оказалась проблема измен- 

`чивости и наследственности организмов. Решение этой проблемы 
явилось мощным стимулом к развитию экспериментальных мето- 
дов и, как следствие, к развитию биометрии. 

Одним из тех, кто испытал на себе влияние гениального труда 
Дарвина «Происхождение видов» (1859), был его двоюродный 
брат Ф. Гальтон. Сильное впечатление произвели на Гальтона и 
труды Кетле, особенно его «Социальная физика» и «Антрополо- 
гия». Поэтому неудивительно, что именно Гальтону принадлежит 
первая попытка применить статистические методы к решению 
проблемы наследствеиности и изменчивости организмов. Начи- 
ная с 1865 г. Гальтон опубликовал ряд оригинальных работ по 
антропологии и генетике. На большом фактическом материале он 
подтвердил вывод Кетле о том, что не только физические, но и 
умственные способности человека распределяются по закону ве- 
роятностей, описываемому формулой Гаусса — Лапласа. 

Достойным продолжателем исследований Гальтона явился его 
ученик К. Пирсон — профессор Лондонского университета, Полу- 
чив в 1884 г. кафедру прикладной математики и механики, Пир- 
сон занялся изучением проблемы наследственности и изменчи- 
вости организмов. Он создал математический аппарат биомет- 
рии; развил учение о разных типах кривых распределения, раз- 
работал метод моментов (1894) и критерий согласия «хи-квад- 
рат» (1990). Пирсон ввел в биометрию такие показатели, как 
среднее квадратическое отклонение (1894) и коэффициент вариа- 
ции (1896). Ему принадлежит усовершенствование методов кор- 
реляции и регрессии Гальтона (1896, 1898). Вместе с Д. Гальто- 
ном и Уэльдоном Пирсон организовал выпуск журнала «Биомет- 
рика» (1901), редактором которого он оставался до конца своей 
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жизни. Этот журнал сыграл важную роль в пропаганде биомет- 
рических методов, в создании английской школы биометриков. 

Разработанные Гальтоном и Пирсоном биометрические мето- 
ды вошли в золотой фонд математической статистики. Однако 
попытки Гальтона применить эти методы к решению проблемы 
наследственности организмов оказались неудачными. Гальтон и 
Пирсон полагали, что по внешнему сходству между родственни- 
ками можно судить о степени их родства. Это было ошибкой, 
на которую указал датский ученый В. Иогансен (1857—1927). 
В опытах с фасолью Иогансен пришел к важному выводу о том, 
что биологические проблемы должны решаться с помощью ма- 
тематики, но не как математические задачи. «Статистике, — пи- 
сал Иогансен, — всегда должен предшествовать биологический 
анализ, иначе результаты могут быть «статистической ложью». 
Математика должна оказывать помощь, а не служить в качест- 
ве руководящей идеи» '!. Это был новый, реалистический подход 
к оценке роли математических методов в биологических иссле- 
дованиях. 

Значение биометрии в исследовательской работе биологов 
стало очевидным уже тогда, когда были открыты статистические 
законы, действующие в сфере массовых явлений, Но биологи не 
сразу оценили всю важность этих открытий: во-первых, потому, 
что статистические методы базировались иа больших количест- 
вах наблюдений, а во-вторых, они требовали большой вычисли- 
тельной работы, к чему у биологов, привыкших к работе на 
малочисленных выборках, не было навыка. 

Положение стало меняться после того, как была обоснована 
теория малой выборки. Пионером в этой области явился ученик 
К. Пирсона В. Госсет (1876—1937), опубликовавший в журнале 
«Биометрика» свой труд под псевдонимом «Стьюдент» 2. Даль- 
нейшее развитие теория малой выборки получила в трудах Пир- 
сона и особенно Р. Фишера (1890—1962), внесшего огромный 
вклад в биометрию, обогатив ее новыми методами статистичес- 
кого анализа. На протяжении ряда лет Фишер работал в качест- 
ве научного сотрудника Ротамстедской сельскохозяйственной 
опытной станции, а с 1933 г. — в должности профессора кафедры 
прикладной математики Лондонского университета. Затем, с 1943 
по 1957 г., Фишер заведовал кафедрой генетики в Кембридже. 

Удачно соединяя в своем лице биолога-экспериментатора и 
математика-статистика, Фишер привнес в биометрию не только 
новые методы, но и новые идеи. Он заложил основы пла- 
нирования экспериментов — теории, которая в настоящее время 
получила дальнейшее развитие и стала относительно самостоя- 


1 Иогансен В. Элементы точного учення об нзменчивости и наследствен- 
ности. М., 1933. С. 103. 
Ы А сие Зшает. Тһе ргођаЫе :Еггог ої Меап // Віотеііса. 1908. У\о!. 6. 
. 1—25, 
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тельным разделом биометрии. Фишер ввел в биометрию целый 
ряд новых терминов и понятий и убедительно показал, что пла- 
иирование экспериментов и обработка их результатов — это две 
неразрывно связанные задачи статистического анализа. Класси- 
ческие труды Фишера явились новой вехой в истории биометрии. 
Они доказали, что биометрия — не просто наставление к исполь- 
зованию различных технических приемов, применяемых при об- 
работке результатов наблюдений, а нечто большее — наука, за- 
нимающаяся статистическим анализом массовых явлений в био- 
логии. 

Рассматривая историю биометрии, нельзя не отметить тот ог- 
ромный вклад в развитие теории вероятностей и математической 
статистики, который внесли такие ученые нашей страны, как 
С. Н. Бернштейн (1880—1968), А. Я. Хинчин (1894—1958), Е.Е. 
Слуцкий (1880—1948), А. И. Хотимский (1892—1939), Б. С. Яст- 
ремский (1877—1962), В. И. Романовский (1879—1954), В. С. 
Немчинов (1894--1964) и многие другие, особенно А. Н. Колмо- 
горов и его школа, получившие мировое признание. 

Первый учебник по теории вероятностей был издан в России 
в 1846 г. акад. В. Я. Буняковским (1804—1889). А первая полная 
сводка биометрических методов была составлена в 1909 г. акад. 
А. В. Леонтовичем (1869—1943). В 1910 г. появились «Очерки по 
теории статистики» А. И. Чупрова (1874—1926). В 1916 г. вышло 
в свет третье издание руководства по статистическим методам 
А. А. Кауфмана (1864—1919). 

Поток биометрической литературы заметио возрос в нашей 
стране после Великой Октябрьской социалистической революции. 
Биометрические методы стали применять в самых различных от: 
раслях биологии и смежных наук. В. В. Алпатов (1898—1979) и 
его последователи с успехом применили биометрию в пчеловодст- 
ве. Н. А. Плохинский (1899—1987), П. Ф. Рокицкнй (1902—1977), 
А. С. Серебровский (1892—1948) и др. — в области генетики и 
селекции животных. М. В. Игнатьев (1894—1959) и Ю. П. Зы- 
бин установили количественные параметры для раскроя и стан- 
дартизации обуви и одежды, изготовляемой для массового по- 
требления. В. В. Бунак (1891—1979), И. И. Шмальгаузен (1884— 
1963) применили биометрию к изучению закономерностей роста и 
развития организмов животных и человека. П. В. Терентьев 
(1903—1970) обосновал метод корреляциониых плеяд, зоогеогра- 
фическое «правило оптимума». А. А. Ляпунов (1911—1973) был 
одним из основателей математической биологии и кибернетики в 
иашей страие. В кратком разделе невозможно перечислить имена 
всех ученых, внесших свою лепту в развитие биометрии. 

Возрастающая роль биометрии в исследовательской работе 
естественно сказалась на подготовке специалистов биологическо- 
го профиля. Первым, кто еще в 1919 г. начал читать студентам 
Московского университета курс биометрии с основами генетики, 


15 


был С. С. Четвериков (1880—1959). В 1924 г. он читал уже само- 
стоятельный курс «Введение в биометрию». В дальнейшем курс 
биометрии в МГУ читали В. В. Алпатов, М. В. Игнатьев и др. 

Основателем Ленинградской школы биометриков был Ю. А. 
Филипченко (1882—1930), организовавший при Ленинградском 
университете первую в нашей стране кафедру генетики. Филип- 
ченко не только умело применял биометрию в исследовательской 
работе, но и пропагандировал ее в нашей стране. Написанное им 
руководство по биометрии «Изменчивость и методы ее изучения» 
еще при жизни автора выдержало четыре издания (1923, 1925, 
1927, 1929). После смерти Филипченко курс биометрии в ЛГУ 
читал его ученик А. И. Зуйтин, погибший в 1942 г.в блокадном 
Ленинграде. Затем биометрию в ЛГУ стал преподавать П. В. Те- 
рентьев, талантливый ученик С. С. Четверикова, внесший замет- 
ный вклад в развитие биометрии. Он первый ввел преподавание 
биометрии применительно к большому практикуму по зоологии 
позвоночных животных. П. В. Терентьев был одним из первых ор- 
ганизаторов курсов повышения квалификации биологов по вопро- 
сам применения математических методов в биологии и четырех 
Всесоюзных совещаний (1958—1964), посвященных этому воп- 
росу. 

Большая работа по обучению специалистов лесного и сельско- 
го хозяйства биометрическим методам была проведена Ю. Л. 
Поморским (1893—1954). Много сделано в области пропаган- 
ды статистических методов А. К. Митропольским и другими 
учеными нашей страны. По учебным руководствам Ю. А. Фи- 
липченко, Ю. Л. Поморского, В. И. Романовского и других уче- 
ных воспиталось целое поколение отечественных биометриков. 

Итак, биометрия в своем историческом развитии прошла дол- 
гий и сложный путь — от чисто словесного описания биологичес- 
ких объектов к их измерениям, от статистических сводок и таб- 
лиц к статистическому анализу массовых явлений. В истории 
биометрии можно отметить несколько периодов, или этапов. Пер- 
вый период, описательный, берет свое начало в ХУІ столетии. В 
это время происходит переход от словесного описания и элемен- 
тарного количественного учета биологических объектов к их чис- 
ловым характеристикам. Измерения рассматриваются как метод 
научного познания живой природы. 

Второй период, начавшийся в первой половине ХІХ в., озна- 
менован работами А. Кетле. В это время закладываются основы 
биометрии как науки, целью которой является не описание явле- 
ний, а их анализ, направленный на открытие статистических за- 
кономерностей, которые действуют в сфере массовых явлений. 
Биометрию рассматривают одновременно и как науку, и как ме- 
тод научного познания. 

Третий период, формалистический, характеризуется возникно- 
вением и развитием английской биометрической школы во главе 
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с Ф. Гальтоном и К. Пирсоном. В это время создают математи- 
ческий аппарат биометрии и предпринимают попытки применить 
его к изучению проблемы наследственности и изменчивости орга- 
ВИЗМОВ. 

Четвертый период, рационалистический, начинается с 1902 г. 
классическими исследованиями Иогансена, показавшего, что в 
области биологических исследований первое место должно при- 
надлежать биологическому эксперименту, а не математике. Ма- 
тематические методы должны применяться как вспомогательный 
аппарат при обработке экспериментальных данных. 

Пятый период в развитии биометрии открывают классические 
работы Стьюдента и Р. Фишера. В это время создаются основы 
теории малой выборки, теории планирования экспериментов, вво- 
дятся в содержание биометрии новые термины и понятия. Все эти 
новшества связаны с революцией в биологии, с ломкой устарев- 
ших принципов и понятий в области исследовательской работы, 
с усилением процесса математизации биологии. Происходит все 
более заметная специализация биометрии, применения ее мето- 
дов в самых различных областях биологии, медицины, антропо- 
логии и других смежных науках. 


ГЛАВА 1 


ОСНОВНЫЕ ПОНЯТИЯ БИОМЕТРИИ. 
ГРУППИРОВКА ПЕРВИЧНЫХ ДАННЫХ 


1.4. ПРЕДМЕТ И ОСНОВНЫЕ ПОНЯТИЯ БИОМЕТРИИ 


Предметом биометрии служит любой биологический объект, 
изучаемый с применением счета или меры, т. е. с количественной 
стороны в целях более или менее точной оценки его качественно- 
го состояния. При этом, как уже сообщалось, имеются в виду не 
единичные, а групповые объекты, т. е. явления массовые, в сфере 
которых проявляют свое действие статистические законы. Напри- 
мер, врач принял больного и назначил необходимое ему лекар- 
ство — это единичное явление, отдельный акт. Если же врач при- 
нял несколько больных или подверг неоднократному осмотру 
одного и того же больного, — это массовое явлеиие независимо 
от того, каким был объект наблюдения — единичным или груп- 
(09:75070 

Обычно наблюдения проводят на групповых объектах, напри- 
мер на особях одного и того же вида, пола и возраста, которые 
рассматривают как составные элементы, или члены группового 
объекта, и называют единицами наблюдения. Множество отно- 
сительно однородных, но индивидуально различимых единиц, 
объединенных для совместного (группового) изучения, называют 
статистической совокупностью. 

Понятие статистической совокупности — одно из фундамен- 
тальных биометрических понятий. Оно базируется на принципе 
качественной однородности ее состава. Нельзя объединять в од- 
ну совокупность особей разного пола и возраста, когда речь идет 
о нормах питания, стандартизации обуви и одежды, поскольку 
заведомо известно, что с возрастом и в зависимости от пола ин- 
дивидов меняются их потребности в питании и закономерно из- 
меняются размеры и пропорции тела. Недопустимо изучать за- 
коиомерность модификационной изменчивости на генетически не- 
однородном материале, объединяя в одну совокупность Чистопо- 
родных и гибридных особей и т. д. | 

Наряду с понятием статистической совокупности существует 
понятие статистического комплекса. Так, если етатистическая со- 
вокупность состоит из относительно однородных единиц, то ста- 
тистический комплекс слагается из разнородных групп, объеди- 
няемых для совместного (комплексного) изучения. При этом 
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каждая группа, входящая в состав комплекса, должна состоять 
из однородных элементов. Например, в массе подопытных жи- 
вотных наряду с контролем может быть образовано несколько 
групп, отличающихся друг от друга по возрасту, породной или 
видовой принадлежности и т. п., на которых испытывают дейст- 
вие изучаемого агента. При испытании различных доз удобрений 
каждую опытную делянку рассматривают как отдельную группу, 
входящую в состав статистического комплекса. 

Вопрос о форме объединения биометрических данных экспе- 
риментатор решает сам в зависимости от объекта и цели иссле- 
дования. Объединяемые в статистическую совокупность или ста- 
тистический комплекс результаты наблюдений представляют не- 
кую систему, не сводимую к сумме составляющих ее единиц или 
компонентов. В статистических совокупностях и в статистических 
комплексах существует внутренняя связь между частью и целым, 
единичным и общим, которая находит свое выражение в статис- 
тических закономерностях, обнаруживаемых в сфере массовых 
явлений. Эти закономерности являются той теоретической плат- 
формой, на которой базируется биометрия. 


1.2. ДИАЛЕКТИКА СВЯЗИ МЕЖДУ ЕДИНИЧНЫМ И ОБЩИМ 


Между частью и целым, единичным и общим, на первый 
взгляд не существует разницы. Ведь «отдельное не существует 
иначе как в той связи, которая ведет к общему». Равно как и 
«общее существует лишь в отдельном, через отдельное»!. Нель- 
зя представить поле пшеницы или ржи без множества произра- 
стающих на нем растений данной культуры. 

Однако связь между единичным и общим, частью и целым не- 
простая. Диалектика этой связи заключается в том, Что «всякое 
общее лишь приблизительно охватывает все отдельные предме- 
ты. Всякое отдельное неполно входит в общее...»?. Такова фило- 
софская сторона рассматриваемых понятий. 


1.3. ПРИЗНАКИ И ИХ СВОЙСТВА 


В общем смысле под словом «признак» подразумевают свой- 
ство, проявлением которого один предмет отличается от друго- 
го. В области биологии признаками, по которым проводят наблю- 
дения над объектами, служат такие характерные особенности в 
строении и функциях живого, которые позволяют отличать одну 
единицу наблюдения от другой, сравнивать их между собой. На- 
пример, исследователя интересует содержание зерен в колосьях 
пшеницы или ржи, возделываемой на специально подготовлен- 


+ Ленин В. И. Полн. собр. соч. Т, 29, С, 318, 
2 Там же, 
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ном участке. Массив данной культуры и будет объектом наблю- 
дения, а признаком — количество зерен в колосьях отдельных 
растений, которые являются единицами наблюдения, составляя в 
общей массе, подвергаемой изучению, статистическую совокуп- 
ность. 

Характерным свойством биологических признаков является 
варьирование величины признаков в определенных пределах при 
переходе от одной единицы наблюдения к другой. Например, под- 
считывая наличие зерен или колосков в колосьях, взвешивая де- 
тенышей животных одного и того же помета, определяя жир- 
ность молока у животных однородной группы и в других подоб- 
ных случаях, нетрудно заметить, что величина каждого призна- 
ка колеблется, образуя совокупность числовых значений призна- 
ка, по которому проводят наблюдение. Эти колебания величины 
одного и того же признака, наблюдаемые в массе однородных 
членов статистической совокупности, называют вариациями (от 
лат. үагіаііо — изменение, колебания), а отдельные числовые 
значения варьирующего признака принятого называть варианта- 
ми (от лат. уагіапѕ, үагіапііѕ — различимый, изменяющийся) '. 


1.4. КЛАССИФИКАЦИЯ ПРИЗНАКОВ 


Все биологические признаки варьируют, но все они поддаются 
непосредственному измерению. Отсюда возникает деление приз- 
наков на качественные, или атрибутивные, и количественные. 

Качественные признаки не поддаются непосредственному из- 
мерению и учитываются по наличию их свойств у отдельных чле- 
нов изучаемой группы. Например, среди растений можно подсчи- 
тать количество экземпляров с разной окраской цветков — бе- 
лой, розовой, красной, фиолетовой и т. д. В массе животных 
также нетрудно отличить и учесть особей разного пола и мас- 
ти — серых, вороных, гнедых, пестрых и др. 

Количественные признаки поддаются непосредственному из- 
мерению или счету. Их делят на мерные, или метрические, и 
счетные, или меристические. Длина колосьев, урожайность той 
или иной культуры, мясная и молочная продуктивность живот- 
ных — все это мерные признаки, варьирующие непрерывно: их 
величина может принимать в определенных пределах (от—до) 
любые числовые значения. Счетные признаки, такие, например, 
как число зерен или колосков в колосьях, яйценоскость и дру- 
гие подобные признаки, варьируют прерывисто или дискретно: 
их числовые значения выражаются только целыми числами. 

Если результаты наблюдений группируются в противопостав- 
ляемые друг другу группы, их варьирование в отличие от рядо- 


+ По терминологни Р. Фишера, числовые значения признаков называют- 
ся датами. 
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. вой изменчивости называют альтернативным и признаки, по ко- 

‘торым проводят наблюдение, — альтернативными. Примером мо: 
гут служить случаи, когда противопоставляют особи женские 
мужским, больные — здоровым, высокорослые — низкорослым, 
успевающие — неуспевающим и т. д. 

Деление признаков на качественные и количественные весьма 
условно. Например, в массе однородных индивидов, доступных 
измерению, можно выделить группы высоких, средних и низких, 
а также успевающих и неуспевающих и т. д. Вместе с тем в каж- 
дом качественном признаке, например в окраске листьев, цвет- 
ков и плодов, можно обнаружить целую гамму количественных 
переходов, или градаций, и измерить их. И все же, несмотря на 
очевидную условность приведенной классификации, она необхо- 
дима хотя бы потому, что количественные признаки распределя- 
ются в вариационный ряд, а качественные не распределяются 
(см. ниже). А при разных способах группировки исходных дан- 
ных применяют разные способы их обработки. 

На языке математики величина любого варьирующего приз- 
нака является переменной случайной величиной. В отличие от 
постоянных величин, обозначаемых начальными буквами латин- 
ского алфавита, переменные величины принято обозначать 
последними в латинском алфавите прописными буквами Х, У, 2, 
а их числовые значения, т. е. варианты, — соответствующими 
строчными буквами того же алфавита: хи, х2, Хз, ...,Хи ИЛИ ў, 02, 
бз, .., Уп И т. д. Общее обозначение любой варианты отмечают 
символом хь, И; И Т. д., где индекс і символизирует общий харак- 
тер варианты (даты) !. 


1.5. ПРИЧИНЫ ВАРЬИРОВАНИЯ РЕЗУЛЬТАТОВ 
НАБЛЮДЕНИЙ 


Биологические признаки варьируют под влиянием самых 
различных, в том числе и случайных, причин. Наряду с естест- 
венным варьированием на величине признаков сказываются и 
ощибки, неизбежно возникающие при измерениях изучаемых 
объектов. Опыт показал, что как бы точно ни были проведены 
измерения, они всегда сопровождаются отклонениями от дейст- 
вительного значения измеряемой величины, т. е. не могут быть 
проведены абсолютно точно. Разница между результатами изме- 
рений и действительно существующими значениями измеряемой 
величины называется погрешностью или ошибкой. 

Ошибки возникают из-за неисправности или неточности изме- 
рительных приборов и инструментов (технические ошибки), 
личных качеств исследователя, его навыков и мастерства в ра- 


1 Классики отечественной биометрии обозначали варнанты буквой У. 
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боте (личные ошибки) и от целого ряда других, не поддающихся 
регулированию и неустранимых причин (случайные ошибки). 

Технические и личные ошибки, объединяемые в категорию 
систематических, т. е. неслучайных ошибок, можно в значитель- 
ной степени преодолеть, совершенствуя технические средства, 
условия работы и личный опыт. Эти меры позволяют свести раз- 
меры таких ошибок до минимума, которым можно пренебречь, 
Случайные же ошибки, как независимые от воли человека, оста- 
ются и сказываются на результатах наблюдений. 

Итак, варьирование результатов наблюдений вызывают при- 
‚чины двоякого рода: естественная изменчивость признаков и 
ошибки измерений. Однако по сравнению с естественным варьи- 
рованием случайные ошибки измерений, как правило, невелики, 
поэтому варьирование результатов наблюдений рассматривают 
обычно как естественное варьирование признаков. 


1.6. ФОРМЫ УЧЕТА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ 


Наблюдения над биологическими объектами проводят обычно 
по принятой исследователем программе. Результаты наблюдений 
фиксируют в дневниках, журналах, бланках, анкетах или других 
документах учета. Существует много различных форм и способов 
учета; выбор той или иной формы определяется задачей иссле- 
дования и теми условиями, в которых оно проводится. Так, на 
маршрутных зоологических и ботанических экскурсиях, при про- 
ведении полевых опытов удобной формой учета служит дневник. 
В условиях лабораторного эксперимента результаты испытаний 
фиксируют в протоколах, журналах, учетных бланках и других 


формулярах. 


1.7. ТОЧНОСТЬ ИЗМЕРЕНИЙ. 
ДЕЙСТВИЯ НАД ПРИБЛИЖЕННЫМИ ЧИСЛАМИ 


Применяя биометрию к решению практических задач, иссле- 
дователь имеет дело с измерениями биологических объектов. 
Обычно измерения проводят с точностью до десятых, сотых или 
тысячных долей единицы, более точные измерения производят 
реже. Практически каждый признак имеет свою меру. Едва ли 
необходимо измерять удой коровы за лактацию с точностью до 
одной сотой миллиграмма. Но было бы недостаточно точным 
выражать измерения жирномолочности не дробными, а целыми 
числами. Конечно, в особых случаях, таких, например, как дози- 
рование или испытание ядов и других сильнодействующих ве- 
ществ, измерения должны быть очень точными, выражаемыми не 
только тысячными, но и миллионными долями единицы. 

Как показывает опыт, нет необходимости в точности измере- 
ний, когда эта точность практичёски не нужна. Данное положе- 
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ние относится и к измеряемым объектам, и к вычислениям обоб- 
щающих статистических характеристик. «Вычисления, — писал 
‘акад. А. Н. Крылов, — можно производить как угодно точно, но 
результат вычисления не может быть точнее тех данных... на ко- 
торых оно основано» '. 

Разумеется, исследователь может иметь дело с точными чис- 
лами, получаемыми в результате счета. Но гораздо чаще прихо- 
дится оперировать приближенными числами, полученными в 
результате измерений. Такие математические операции, как 
нахождение логарифма чисел, деление, извлечение корня и дру- 
гие действия, также в итоге дают приближенные числа. 

Чтобы избежать грубых ошибок в работе и получать сопоста- 
вимые результаты, необходимо неукоснительно соблюдать приз- 
нанные правила записи и округления приближенных чисел. 
„Очень важно, чтобы числа, фиксируемые в документах учета, 
соответствовали точности, принятой при измерении варьирую- 
щих объектов. Так, если измерения проводят с точностью до 
одного десятичного знака, то результаты измерений нельзя за-. 
писывать, например, в таком виде: 5,2; 4; 4.69; 4,083 и т. д. Пра- 
вильная запись этих чисел будет такова: 5,2; 4,0; 4,7; 4,1. 

Числа округляют следующим образом: если за последней 
сохраняемой цифрой следуют цифры 0, 1, 2, 3, 4, они отбрасыва- 
ются (округление с недостатком); если же за последней сохраня- 
емой цифрой следуют цифры 5, 6, 7, 8 и 9, то последняя сохраня- 
емая цифра увеличивается на единицу (округление с избытком). 
Например, числа 45,346; 8,644; 9,425; 3,585 и 3,575 округляются 
до двух десятичных знаков так: 45,35; 8,64; 9,43; 3,59 и 3,58. 

Многие исследователи считают более точным такое правило: 
` если за последней сохраняемой цифрой следует цифра 5 (с нуля- 
ми или без оных после нее), то округление осуществляется с не- 
достатком при условии, что сохраняемая цифра четная. Если же 
сохраняемая цифра нечетная, то округление осуществляется с 
избытком. Например, числа 3,585 и 3,575 округляются до двух 
десятичных знаков таким образом: 3,58 и 3,58. 


1.8. СПОСОБЫ ГРУППИРОВКИ ПЕРВИЧНЫХ ДАННЫХ 


Зафиксированные в документах учета сведения об изучаемом 
объекте (или объектах) представляют тот первичный фактиче- 
ский материал, который нуждается в соответствующей обработ- 
ке. Обработка начинается с упорядочения или систематизации 
собранных данных. Процесс систематизации результатов массо- 
вых наблюдений, объединения их в относительно однородные 
группы по некоторому признаку называется группировкой. 


3 Крылов А. Н. Лекции о приближенных вычислениях. М., 1933. С. 486. 
93 


Группировка — это не просто технический прием, позволяк. 
щий представить первичные данные в комплексном виде, но № 
глубоко осмысленное действие, направленное на выявление 
связей между явлениями. Ведь от того, как группируется исход- 
ный материал, во многих случаях зависят выводы о природ+ 
изучаемого явления. Один и тот же материал дает диаметральнс 
противоположные выводы при разных приемах группировкь 
Нельзя группировать в одну и ту же совокупность неоднородны+ 
по составу данные, необдуманно выбирать способ группировки 
Группировка должна отвечать требованию поставленной задачу 
и соответствовать содержанию изучаемого явления. 

Таблицы. Наиболее распространенной формой группировкі. 
являются статистические таблицы; они бывают простыми т 
сложными. К простым относятся, например, четырехпольны+ 
таблицы, применяемые при альтернативной группировке, когд: 
одна группа вариант противопоставляется другой; наприме 
здоровые — больным, высокие — низким ит. д. В качестве приме- 
ра такой группировки могут служить результаты обследования 
а ТАЕ младших классов на состояние нёбных миндали» 

табл. 1). 


Таблица _ 


Обнаружено детей 


Школьные классы Всего 
здоровых больных 
Третьи и четвертые 63 92 155 
Пятые и шестые 71 39 110 
Всего 134 131 


Из табл. 1 видно, что заболевание нёбных миндалин, по-ви- 
димому, чаще встречается среди учащихся третьих и четверты: 
классов. 

К сложным относятся многопольные таблицы, применяемы* 
при изучении корреляционной зависимости и при выяснении при 
чинно-следственных отношений между варьирующими признак: 
ми. Примером корреляционной таблицы служат классические 
данные Гальтона, показывающие наличие положительной зависи 
мости между ростом родителей и ростом их детей (табл. 2). 

В качестве примера группировки, применяемой при выясне- 
нии причинно-следственных отношений между признаками, пре 
ведены данные, полученные в Научно-исследовательском инсть 
туте имени В. В. Докучаева при испытании гречихи сорта «Бе. 
а на урожайность в зависимости от предшественнико+ 

табл. 3). 
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Таблица 2 


Рост детей, дюймы 


Рост 
-однтелей, 
дюймы 60,7 


Всего 


62,7 64,7 70,7 72,7 74,7 


66,7 | 68,7 


Из табл. 3 ясно, что в данных условиях лучшим предшествен- 
‚ком для гречихи является, по-видимому, ячмень. 
Таблица 3 


Средннй 


Предшественникн урожай 
1 2 з 
Горох раннезеленый 23,7 20,1 20,5 21,4 
Чечевица 23,6 25,1 21,1 23,2 
Чина степная № 21 26,7 23,2 23,8 24,6 
Ячмень ; , 


Приведенными таблицами не исчерпывается их многообразие. 
десь рассмотрены лишь типичные для курса биометрии приме- 
зы. Из этих примеров видно, что статистические таблицы имеют 
ле только иллюстративное, но и аналитическое значение, позво- 
ляя обнаруживать связи между варьирующими признаками. 

Статистические ряды. Особую форму группировки представ. 
яют так называемые статистические ряды. Статистическим на- 
зывается ряд числовых значений признака, расположенных в 
тределенном порядке. В зависимости от того, какие признаки 
зучаются, статистические ряды делят на атрибутивные, вариа- 
(ионные, ряды динамики и регрессии, а также ряды ранжирован- 
лых значений признаков и ряды накопленных частот, являющих- 
‘я производными вариационных рядов. Примером атрибутивного 
зяда могут служить данные, показывающие зависимость между 
‘одержанием гемоглобина НЬ в крови и высотой организации 
тозвоночных животных: 


‹ласс животных , . .. Рыбы Амфибии Рептилии Птицы Млеко- 
питаю- 
щие 

‹оличество НЬ, г/кг мас- 

ы тела. ....... 1,6 2,9 3,8 11,2 117 
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Среди группировок видное место занимают вариационные 
ряды. На их описании следует остановиться более подробно. 
Ряды регрессии, динамики и другие будут рассмотрены в после- 
дующих главах. 

Вариационным рядом или рядом распределения называют 
двойной ряд чисел, показывающий, каким образом числовые 
значения признака связаны с их повторяемостью в данной ста- 
тистической совокупности. Например, из урожая картофеля, 
собранного иа одной из опытных делянок, случайным способом, 
т. е. наугад, отобрано 25 клубней, в которых подсчитывали число 
глазков. Результаты подсчета оказались следующие: 6, 9, 5, 7, 10, 
8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 11, 9, 10. Чтобы 
разобраться в этих данных, расположим их в ряд (в порядке 
регистрации результатов наблюдений) с учетом повторяемости 
вариант в этой совокупности; 


6 956710811 12 
17126213: 


Это и есть вариациониый ряд. Числа, показывающие, сколько 
раз отдельные варианты встречаются в данной совокупности, 
называются частотами или весами вариаит и обозначаются 
строчной буквой латинского алфавита {. Общая сумма частот 
вариационного ряда равна объему данной совокупности, т. е, 


Вариаиты х:..... 
Число иариант ў; .. . 


в в 
х л=п, где х (греческая буква сигма прописная) обозна- 
Г = 


чает действие суммирования, в даииом случае суммирование 
частот вариационного ряда от первого ({=1) до А-го класса, а 
п — общее число наблюдений, или объем совокупности. 
Частоты (веса) выражают не только абсолютными, но и от- 
носительными числами — в долях единицы или в процентах от 
общей численности вариант, составляющих данную совокуп- 
ность. В таких случаях веса называют относительными частотами 
или частостями. Общая сумма частостей равна единице, т. е. 
х/п==1, или У (р/т) 100==10094, если частоты выражены в про- 
центах от общегс числа наблюдений п. Замена частот частостями 
не обязательна, но иногда оказывается полезной и даже необхо- 
димой в тех случаях, когда приходится сопоставлять друг с дру- 
гом вариационные ряды, сильно отличающиеся по их объемам. 
Распределение исходных данных в вариационный ряд пресле- 
дует определенные цели. Одна из них — ускорение работы при 
вычислении по вариационному ряду обобщающих числовых ха- 
рактеристик — средней величины и показателей вариации (см. 
гл. П). Другая сводится к выявлению закономерности варьиро- 
вания учитываемого признака. Приведенный ряд удовлетворяет 
первой, но не удовлетворяет достижению второй цели. Чтобы 
ряд распределения полностью удовлетворял предъявляемым 
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к нему требованиям, его нужно строить по ранжированным зна- 
чениям признака. 

Под ранжированием (от франц. гапрег — выстраивать в ряд 
по ранжиру, т. е. по росту) понимают расположение членов ряда 
в возрастающем (или убывающем) порядке. Так, в данном слу- 
чае результаты наблюдений следует распределить так: 


Вариаиты х......5 6 т 8 9 10 Ш 12 
Частоты НН... ..-.. 1 1 247 63 1 


Зтот упорядоченный ряд распределения в равной мере удов- 
летворяет достижению и первой, и второй целей. Он хорошо 
обозрим и наилучшим образом иллюстрирует закономерность 
варьирования признака. 

В зависимости от того, как варьирует прнзнак — дискретно 
или непрерывно, в широком или узком диапазоне, — статистиче- 
ская совокупность распределяется в безынтервальный или интер- 
вальный вариационные ряды. В первом случае частоты относятся 
непосредственно к ранжированным значениям признака, которые 
приобретают положение отдельных групп или классов вариаци- 
онного ряда, во втором — подсчитывают частоты, относящиеся к 
отдельным промежуткам или интервалам (от — до), на которые 
разбивается общая вариация признака в пределах от минималь- 
ной до максимальной варианты данной совокупности. Эти проме- 
жутки, или классовые интервалы, могут быть равными и не рав- 
ными по ширине. Отсюда различают равно- и неравноинтерваль- 
ные вариационные ряды. Примером неравноинтервального ряда 
распределения могут служить данные А. Ф. Ковшарь (1966), 
показывающие зависимость между числом стай сизых голубей 
и количеством особей в стае в гнездовой (с 15 марта по 15 авгус- 
та) и послегнездовой (с 15 августа по 15 марта) периоды их 
жизни (табл. 4). 

В неравноинтервальных рядах характер распределения час- 
тот меняется по мере изменения ширины классовых интервалов. 
Поэтому в качестве числовых характеристик таких рядов исполь- 
зуют особые показатели (см. гл. П). 

Неравноинтервальную группировку в биологии применяют 
сравнительно редко. Как правило, биометрические данные рас- 
пределяются в равноинтервальные ряды, что позволяет не только 
выявлять закономерность варьирования, но и облегчает вычисле- 
ние сводных числовых характеристик вариационного ряда, сопо- 
ставление рядов распределения друг с другом. 

Приступая к построению равноинтервального вариационного 
ряда, важно правильно наметить ширину классового интервала. 
Дело в том, что грубая группировка (когда устанавливают очень 
широкие классовые интервалы) искажает типичные черты варьи- 
ровання и ведет к снижению точности числовых характеристик 
ряда. При выборе чрезмерно узких интервалов точность обобща- 
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ющих числовых характеристик повышается, но ряд получается 
слишком растянутым и не дает четкой картины варьирования. 


Таблица 4 
Число встреч (частота) Плотность распределения 
в гнездовой в остальное в гнездовой в остальное 
пернод время года период время года 
Зале м 
особе! ш Ф а | Й ч а 
в стае Е а Е Е 2 = Е Ы я Е я 
СЕ ЕЯ ВЕ ЕЯ $ .Е е 5 
ТЕГ ЕЕЕ ВОИ ВВ |8 
88 | 2 | 38 | 1 3 |3 ЕЕ 
чи оа 9 0 яв ЕЈ ош $ ох 
Одиноч- 6 18,20 1 1,70 6,00 | 18,20 1,00 1,70 
КИ 
2—5 19 57,60 9 15,25 6,33 | 19,20 3,00 5,08 
5—10 4 12,10 4 6,78 0,80 2,42 0,80 1,36 
10—20 2 6,10 12 20,34 0,20 0,61 1,20 2,03 
20—30 1 3,00 13 22,03 0,10 0,30 1,30 2,20 
30—50 1 3,00 И 18,65 0,05 0,15 0,55 0,93 
50—100 0 0,00 9 15,25 0, 0,00 0,18 0,31 
Всего 33 100 59 100 — — — — 
встреч 


Примечание. Четыре последние графы понадобятся в дальнейшем 
(см. разд. 11.1). 


Для получения хорошо обозримого вариационного ряда к 
обеспечения достаточной точности вычисляемых по нему числс 
вых характеристик следует разбить вариацию признака (в прє 
делах от минимальной до максимальной варианты) на такое чи‹ 
ло групп или классов, которое удовлетворяло бы обоим требс. 
ваниям. Эту задачу решают делением размаха варьировани» 
признака на число групп или классов, намечаемых при построе- 
нии вариационного ряда: 


== Хпах — Хтіп (Г 
К э 
где ^ — величина классового интервала; Хах, Хшш — максималь- 
ная и минимальная варианты совокупности; К — число классоЕ 
на которые следует разбить вариацию признака. 

Число классов (К) можно приблизительно наметить, поль- 
зуясь табл. 5. 

Более точно величину К можно определить по формул+ 
Стерджеса: К==1-+3,32 16 п. При наличии в совокупности боль 
шого числа членов (п 100) можно использовать формулу К== 
==5 2=5 16и (1 п (К. Брукс, Н. Карузерс, 1963) !. 


В тех ел чаях, когда по вариациоиному ряду вычисляют числовые хе 
рактеристики (средние, дисперсии и др.) согласно рекомендации Д. Юла Е 
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Вопрос о том, распреде- Таблица 5 
лять ли собранные данные в 
интервальный или безынтер- Ао неба нЕ и хдесоов 
вальный ряд, решают в зави- 
симости от характера и разма- 


ха варьирования признака. 25—40 5—6 
Если признак варьирует дис- 40—60 6—8 
кретно и слабо, т. е. в узких 60—100 7—10 
границах (величииа А оказы- 100200 аа 

> 200 10—15 


вается равной единице или мо- 
жет быть приравнена к еди- 
нице), данные распределяются в безынтервальный вариацион- 
ный ряд. Если же признак варьирует в широких границах, то 
независимо от того, как он варьирует — дискретно или непре- 
рывно, по данным строят интервальный вариационный ряд. 

Техника построения вариационных рядов. Приступая к пост- 
роению вариационного ряда, нужно в сводке исходных данных 
отыскать минимальную хшш и максимальную Хшах варианты. За- 
тем, используя формулу (1), определить величину классового 
интервала л. Если окажется, что ^==1, собранный материал рас- 
пределяется в безынтервальный вариационный ряд; если же А5 
521, исходные данные необходимо распределять в интервальный 
ряд. При этом точность величины классового интервала должна 
соответствовать точности, принятой при измерении признака. 
Например, жирномолочность коров 00) содержащихся на 
ферме, варьирует от 3,21 до 4,55%. В таком случае классовый 
интервал устанавливается следующим образом: 


Е С. 194040. 
1+3,32 1560 1+ 5,90 


Если точность измерения данного признака ограничить десятыми 
долями единицы, величина классового интервала окажется сле- 


дующей: 


асе Вр 
6,9 


В обоих случаях результаты наблюдений должны распределяться 
в интервальный вариационный ряд. 

При построении интервального вариационного ряда следует 
поступать так, чтобы минимальная варианта совокупности попа- 
дала примерно в середину первого классового интервала. Выпол- 
нение этого требования гарантирует построение вариационного 
ряда, наиболее полно отвечающего природе изучаемого явления, 


М. Кендэла (1960), следует выделять 15—20 классовых интервалов незави- 
симо от числа наблюдений, что обеспечит достаточную компактность вычисле- 
ний и практическую их точность. (Прим. ред.) 
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а следовательно, и наименьшие потери информации о точности 
вычисляемых статистических характеристик ряда. Этому требо- 
ванию удовлетворяет формула 


Хи== Хоа М2, (2) 


где Хн — нижняя граница первого классового интервала; хаш — 
минимальная варианта исследуемой совокупности; А — величина 
классового интервала. 

Так, при ьп = 3,21 и А=0,19 нижняя граница первого класса 
Хн==3,21—0,19/2=3,115 23,12. Прибавив к этой величине д= 
==0,19, определяем верхнюю границу первого класса: 3,124- 
--0,19=3,31. Затем находим верхнюю границу второго класса: 
3,31--0,19 =3,50 и т. д., пока не получим интервал, в который 
попадает максимальная варианта совокупности (хтах==4,55). 

Наметив классовые интервалы, остается распределить по ним 
все варнанты совокупности, т. е. определить частоты каждого 
класса. Тут, однако, возникает вопрос: в какие классы относить 
варианты, которые по своей величине совпадают с верхней гра- 
ницей одного и нижней границей другого, соседнего класса? 
Например, в какой класс следует отнести варианту 3, 31 — в пер- 
вый или во второй? Этот вопрос решается по-разному. Можно 
помещать в один и тот же класс варианты, которые больше ниж- 
ней, но меньше или равны его верхней границе, т. е. по принципу 
«от и до включительно». Чаще, однако, поступают таким обра- 
зом: верхние границы классов уменьшают на величину, равную 
точности, принятой при измерении признака, чем и достигается 
необходимое разграничение классов. 

Следующий шаг ведет к замене классовых интервалов на их 
центральные или срединные значения. В результате интерваль- 
ный вариационный ряд превращается в безынтервальный ряд. 
Необходимость такой замены вызывается тем, что обобщающие 
числовые характеристики (средняя, дисперсия и др.) вычисляют- 
ся по безынтервальным рядам. Срединные значения классовых 
интервалов х;, как это следует из формулы (2), отстоят от их 
нижних границ хн на величину, равную половине классового ин- 
тервала. 

Наиболее точно центральную величину классового интервала 
можно получить по формуле 


хх»), (3) 


где Хк — конечная точка интервала, равная хн+:—в, т. е. началу 
следующего класса, уменьшенному на точность измерения приз: 
нака. 

Середины классов приобретают значения отдельных вари- 
ант и называются классовыми вариантами в отличие от кон- 
кретных вариант, составляющих данную совокупность. Описан- 
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ную методику можно продемонстрировать на конкретных при- 
мерах. 

Пример 1. На свиноферме зарегистрировано 64 опороса. Ко- 
личество поросят, полученных от каждой свиноматки, варьиро- 
вало следующим образом: 


8 106 108517 10697879 Пвоэ 0 
8 78187 108 851 810127 579 7 
10 589712 89 678 7и 86790 
В этой совокупности Хши==б и Хпах=12. Отсюда 

ва. ее 

143,321264 1+6 


Так как признак варьирует дискретно и А==1, совокупность 
наблюдений следует распределить в безынтервальный вариаци- 
онный ряд, т. е. непосредственно по ранжированным значени- 
ям признака, которые и будут классами данного ряда. 

Чтобы при определении частот каждого класса не сбиться 
со счета, нужно построить вспомогательную (расчетную) таб- 
лицу, в которой первая графа заполняется классами (в данном 
случае ранжированными значениями признака), а вторая — 
служит для учета частот ѓ;, распределяемых по этим классам. 

Разноску частот по классам производят следующим обра- 
зом. Просматривая сводку результатов наблюдений, во второй 
графе расчетной таблицы с помощью условных знаков отмеча- 
ют повторяемость вариант для каждого класса. При этом ре- 
комендуется не выискивать одинаковые варианты в общей сово- 
купиости чисел, а разносить их по классам, что не одно и то 
же. Пренебрежение этой рекомендацией приводит к ошибкам, 
лишней затрате труда и времени на выполнение работы. Услов- 
ными знаками при разноске наблюдений по классам могут быть 
точки, черточки и другие условные знаки. Удобным, особенно 
при обработке болыних совокупностей, оказывается следующий 
щифр частот: 


Пе И 


1 2 3 4 5 6 7 


Наилучшим способом разноски вариант является расклад- 
ка бланков, каждый из которых соответствует отдельному наб- 
людению и содержит значения признаков. В этом случае зна- 
чения признака, попадающие в один класс ряда, образуют от- 
дельную стопку бланков. Всего таких стопок окажется столь- 
ко, сколько образовано интервалов вариационного ряда. После 
окончания разноски ее результаты можно неоднократно прове- 
рить просмотром каждой из стопок бланков, т. е. просмотром 
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рәр. 


тех вариант, которые попали в каждый класс ряда. Это позвс 
ляет полностью исключить ошибки, возможные при иных сп‹ 
собах подсчета классовых частот. 

Закончив разноску вариант по классам, переводят шиф 
частот в числа. В результате получается третья графа вспомс 
гательной таблицы, содержащая частоты безынтервального вг 
риационного ряда (табл. 6). 


Таблица 6 


Классы Частоты 
Шифр частот 
Хх, р; 


Полученный вариационный ряд выражает зависимость меж 
ду отдельными вариантами и частотой их встречаемости в дан 
ной совокупности, т. е. закономерность варьирования учитывае 
мого признака. 

Пример 2. На основании многолетних клинических наблк-- 
дений, проводившихся в Сухумском питомнике обезьян, состак 
лена следующая выборка, включающая 100 анализов на содеь- 
жание кальция (мгф) в сыворотке крови низших обезьян (па- 
вианов-гамадрилов): 
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3,6 12,9 12,3 9,9 12,7 11,7 10,8 10,4 10,9 10,2 
4,7 10,4 11,6 117 12,1 10,9 12,1 9,2 10,7 11,5 
31 10,9 12,0 ты 13,5 11,2 13,5 10,1 14,0 10,0 
11,6 12,4 11,9 11,4 12,8 114 10,9 12,7 13,8 13,2 
11,9 10,8 11,0 12,6 10,0 10,3 12,7 11,7 12,1 13,8 
12,2 11,9 11,6 10,6 ИИ 10,7 12,3 115 11,2 11,5 
127 10,5 11,2 11,9 9,7 13,0 9,6 12,5 11,6 9,0 

. 11,5 12,3 12,8 12,6 12,8 12,5 12,8 11,4 12,5 12,3 
14,5 12,3 12,6 117 12,2 12,3 11,6 12,0 13,5 12,5 
11,6 11,9 12,0 11,4 14,7 11,3 13,2 14,3 13,2 14,2 


Нужно сгруппировать эти данные в вариационный ряд, 
В данном случае признак варьирует непрерывно в пределах от 
9,0 до 14,7 мгф. Устанавливаем величину классового интер- 
вала: 


БЕШЕ а ООВ. 
1-3,32 15 100 7,6 

Так как выборку приходится группировать в интервальный ва- 

риационный ряд, определяем нижнюю границу первого класса: 


х,=9,0 9% — 8,6. 


Затем намечаем следующие классовые интервалы: 8,6—9,4— 
10,2—11,0—11,8—12,6—13,4—14,2— 15,0. Получилось восемь ин: 
тервалов. Разграничиваем их на величину, равную точности из: 
мерения признака, т. е. уменьшаем верхние границы интервалов 
на 0,1 мг%ф. Строим вспомогательную расчетную таблицу и раз- 
носим все 100 вариант по намеченным классовым интервалам 
(табл. 7). 

Переводим шифр частот в числа, сумма которых должна 
быть равна объему данной выборки, т. е. Ун==100. В резуль- 
тате получается интервальный вариационный ряд. 

Срединные значения классов, приведенные в табл. 7, полу- 
‚чены прибавлением к нижним границам классов 1/2 классово- 
го интервала — величины, равной 0,8/2==0,4, т. е., по формуле 
(3), 8,6--0,4==9,0; 9,4--0,4=9,8 и т. д. Таким образом, интер- 
вальный вариационный ряд превращен в ряд безынтервальный. 

Пример 3. В результате учета яйценоскости 80 кур, содер- 
жащихся на птицеферме, было установлено, что признак варь- 
ирует от 208 до 250 яиц, полученных от несушки за 1 год. Оп- 
ределяем классовый интервал: 


143,32 12 80 1+ 6,3 


Так как классовый интервал не равен единице, результаты на- 
блюдений нужно распределять в интервальный вариационный 
ряд, несмотря на то что признак варьирует дискретно. Уста- 
навливаем нижнюю границу первого класса: хн==208—6/2= 
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Таблица ” 


Классы 
по уровню кальция 
в сыворотке крови, 
мг% 


Срединные 
значения 
классов 


х; 


Шифр частот | Частоты 
| р; 


8,6-9,3 


9,4-10,1 


102-10,9 


1,0-1,7 


11,8-12,5 


12,6-13,3 


13,4-14,1 


14,2-14,9 


==205. Намечаем классовые интервалы: 205—211—217—223— 
229—235—241—247—253. Уменьшаем верхние границы классоғ 
на единицу: 205—210; 211—216; 217—222; 223—228; 229—285 
235—240; 241—246; 247—252. Дальнейшие действия, относя 
щиеся к построению вариационного ряда, понятны из предыду 
щих примеров. 

Графики вариационных рядов. Для того чтобы более на 
глядно представить закономерность варьирования количествен 
ных признаков, вариационные ряды принято изображать в ви 
де графиков. Так, при построении графика безынтервального ва 
риационного ряда по оси абсцисс откладывают срединные зна 
чения классов, по оси ординат — частоты. Высота перпендику 
ляров, восставляемых по оси абсцисс, соответствует частотах 
классов. Соединяя вершины перпендикуляров прямыми линия 
ми, получают геометрическую фигуру в виде многоугольник: 
называемую полигоном распределения частот. Линия, соеде 
няющая вершины перпендикуляров, называется вариационно 
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„‚ривой или кривой распределения частот вариационного ряда! 
рис. 1). 

При построении графика интервального вариационного ряда 
о оси абсцисс откладывают границы классовых интервалов, 
о оси ординат — частоты интервалов. В результате получается 
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дличество поросят Ё отдельных пометах Границы классовых интервалов 
эне. 1. Полигон распределения чнс- Рис. 2. Гистограмма распреде- 
еиностн поросят в 64 опоросах ления кальция (мг%) в сыво- 
свиноматок ротке крови обезьян 


"ак называемая гистограмма распределения частот. На рис. 2 
зображена гистограмма распределения кальция в сыворотке 
трови обезьян. Если из середин верхних сторон прямоугольни- 
зов гистограммы опустить перпендикуляры на ось абсцисс, 
`истограмма превращается в полигон распределения, а линия, 
юединяющая середины верхних сторон прямоугольников гисто- 
‘раммы, будет представлять собой вариационную кривую. 

Если по оси абсцисс откладывать значения классов, а по 
си ординат — накопленные частоты с последующим соединени- 
м точек прямыми линиями, получается график, называемый 
зимулятой. На рис. 3 изображена кумулята распределения 
зальция в сыворотке крови обезьян. В отличие от вариацион- 
зой кривой, имеющей куполообразную форму, кумулята имеет 
зид $-образной кривой. Накопленные частоты находят последо- 
зательным суммированием, или кумуляцией (от лат. ситша- 
10 — увеличение, скопление) частот в направлении от первого 
ласса до конца вариационного ряда. В данном случае частоты 
яда распределения кальция в сыворотке крови обезьян куму- 
‚ированы следующим образом: 


Частоты Н.......2 6 15 23 51 7 5 
Кумуляты частот Суй ..2 8 23 46 71 88 95 100 


Откладывая по оси абсцисс частоты, а по оси ординат — 
значения классов с последующим соединением геометрических 


1 Это понятие условно, так как такая лниня является не кривой, а лома- 
-ой. (Прим, ред.) 
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точек прямыми линиями, как это показано на рис. 4, получают 
линейный график, называемый огивой. 

По сравнению с эмпирическими вариационными кривыми, 
которые выглядят обычно в виде ломаных линий, кумулята и 
огива имеют более обтекаемую форму. Эта особенность позво: 
ляет в ряде случаев отдавать предпочтение этим графикам пе- 
ред эмпирической вариационной кривой. Центральная точка ку- 
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Рис. 3. Кумулята распределения каль- Рис. 4. Огива распределения кальци; 
ция (мг%) в сыворотке крови обезь- (мг %) в сыворотке крови обезьян 
ян 


муляты совпадает с центром распределения совокупности, чтс 
дает возможность использовать ее при определении, например 
средних доз биологически активных веществ, вызывающих эф. 
фект у 50% подопытных индивидов. Огива позволяет сравни. 
вать друг с другом одновременно несколько эмпирических рас 
пределений неравного объема. 

Следует заметить, что неумелое построение графиков при: 
водит к тому, что последние получаются либо в виде островер 
шинных геометрических фигур с узким основанием, либо плос 
ковершинными, чрезмерно растянутыми по оси абсцисс. В обо 
их случаях графики оказываются плохо обозримыми, нечетк‹ 
отображающими закономерность варьирования. 

Избежать этих недостатков позволяет правило «золотого се. 
чения», согласно которому основание геометрической фигурь 
должно относиться к ее высоте, как 1:0,62. Применительно + 
построению вариационной кривой масштабы на осях прямо 
угольных координат следует выбирать с таким расчетом, чтобь 
основание кривой было в 1,5—2,0 раза больше ее высоты (т. е 
максимальной ординаты). Откладывая по оси абсцисс классе 
вариационного ряда, следует также доводить крайние из них д 
нулевых классов, в которых не содержится ни одной варианты 
В результате вариационной кривой придается законченный 
хорошо обозримый вид. 


ГЛАВА 11 


ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ВАРЬИРУЮЩИХ 
ОБЪЕКТОВ 


: 11,1. СРЕДНИЕ ВЕЛИЧИНЫ 


Вариационные ряды и их графики дают наглядное представ- 
ление о варьировании признаков, но они недостаточны для 
полного описания варьирующих объектов. Для этой цели слу- 
жат особые, логически и теоретически обоснованные числовые 
показатели, называемые статистическими характеристиками. 
К ним относятся прежде всего средние величины и показатели 
вариации. «Закономерность,— по словам В. И. Ленина,— не мо- 
жет проявляться иначе как в средней,... массовой... закономер- 
ности при взаимопогашении индивидуальных уклонений в ту 
или другую сторону» '. 

В отличие от индивидуальных числовых характеристик сред- 
ние величины обладают большей устойчивостью, способностью 
характеризовать целую группу однородных единиц одним (сред- 
ним) числом. И хотя средние величины абстрактны, они впол- 
не понятны и ощутимы. Средний рост, средняя продуктивность, 
средний урожай, средняя успеваемость и другие средние — все 
это понятия абстрактные о конкретном. Значение средних за- 
ключается в их свойстве аккумулировать или уравновешивать 
все индивидуальные отклонения, в результате чего проявляется 
то наиболее устойчивое и типичное, что характеризует качест- 
венное своеобразие варьирующего объекта, позволяет отличать 
один групповой объект от другого. 

В зависимости от того, как распределены первичные дан- 
ные — в равно- или в неравноинтервальный вариационный 
-ряд,— для их характеристики применяют разные средние вели- 
чины. Именно при распределении собранных данных в неравно- 
интервальный вариационный ряд более подходящей обобщаю- 
щей характеристикой изучаемого объекта служит так называе- 
‚мая плотность распределения, т. е. отношение частот или час- 
тостей к ширине классовых интервалов, как это показано в 
табл. 4. Кроме того, числовыми характеристиками таких рядов 
могут служить средние из абсолютных или относительных по- 
казателей плотности распределения. Средняя плотность пока- 
зывает, сколько единиц данной совокупности приходится в 
среднем на интервал, равный единице измерения учитываемого 
признака. Так, по табл. 4 находим, что средние из относитель- 
‚ных (процентных) показателей плотности распределения голу- 
бей в стае в гнездовой период Х! и в остальное время года #; 


1 Ленин В. И. Полн. собр. соч. Т. 26. С. 68, 
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оказываются следующими: Х:== (1/7) (18,20- 19,20--2,42--0,16-- 
-+0,30--0,15--0,00) =40,43/7= 5,7826 и Х.== (1/7) (1,70--5,08-- 
+ 1,36- ...--0,31) =13,61/7=1,94^=2. Таким образом выясня- 
ется, что в среднем относительная плотность численности го- 
лубей в стае в гнездовой период в три раза выше, чем в ос- 
тальное время года. 

В качестве статистических характеристик равноинтерваль- 
ных вариационных рядов применяют степенные и структурные 
(нестепенные) средние величины. Степенные средние вычисля- 
ют из общей формулы 


в |1 А р 
ны - У 28, 


где М — средняя величина; х;—варианта; п — число наблюде- 
ний, для которых вычисляют среднюю; ё — величина, по кото- 
рой определяют вид средней. Так, при А=1 получается средняя 
арифметическая, при &=2 — средняя квадратическая, при == 
—— 1 образуется средняя гармоническая и т. д. Из структур- 
ных средних в биологии применяют медиану, моду и др. 

Средние величины могут характеризовать только однород- 
ную совокупность вариант. Если средняя получена иа качест- 
венно неоднородном материале или выбрана неправильно, без 
учета специфики характеризуемого явления или процесса, она 
окажется фиктивной. При наличии разнородных по составу 
данных их необходимо группировать в отдельные качественно 
однородные группы и вычислять групповые или частные сред- 
ние, 

Средние величины принято обозначать теми же строчными 
буквами латинского алфавита, что и варианты, с той лишь раз- 
ницей, что над буквой, соответствующей средней величине, ста- 
вят черту. Так, если признак обозначен через Х, то его число- 
вые значения выражают буквой х;, среднюю арифметическую — 
х, среднюю гармоническую хһ и т. д.! При вычислении сред- 
них величин и других статистических характеристик не обяза- 
тельно распределять исходные данные в вариационный ряд. 

Средняя арифметическая х. Из общего семейства степенных 
средних наиболее часто используют среднюю арифметическую. 
Этот показатель является центром распределения, вокруг кото- 
рого группируются все варианты статистической совокупности. 
Средняя арифметическая может быть простой и взвешенной. 
Простую среднюю арифметическую определяют как сумму всех 


1 В старых руководствах по биометрии средиие величины обозиачали 
буквой М. 
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членов совокупности, деленную на их общее число: 
п 

+ жа... Вх. 1 

Х == = 9° Ух. (4) 


п 
В этой формуле х; —– значения вариант; У- знак суммирова- 
1—1 
ния вариант в пределах от первой (х:) до п-й варианты; п— 
общее число вариант, или объем данной совокупности. 
Когда отдельные варианты повторяются, среднюю арифме- 
тическую вычисляют по формуле 


х= — Ў х (5) 


и называют взвешенной средней, причем весами, как это пока- 
зывает формула (5), служат частоты вариант }. 

При объединении групповых средних их весами будут объ- 
емы групп п;, по которым эти средние вычислены. Общую 
(взвешенную) среднюю арифметическую нескольких однород- 
ных групп определяют по формуле 

ат + Хопа + зла +... халь Ут) (6) 


р сина 


п + п 4 пз +... +1 Ул 


Пример 1. Содержание гемоглобина в крови, взятой у взрос- 
лых мужчин (п:,=30), оказалось равным в среднем 69,8%. Тот 
же показатель для другой группы мужчин того же возраста 
(п.=20) составил 64,9%. Нужно определить среднюю арнфме- 
тическую из этих двух средннх. Если бы выборки были равно: 
великими, задача решалась бы просто: путем деления суммы 
частных средних на их число, т. е. х= (69,8--64,9) :2==67,35 =: 
2267,4. При разных объемах выборок такой расчет оказыва- 
ется неточным, так как не учитываются веса частных средних. 
Взвешенная средняя будет равна 


х-=30-69.8 +20-64.9 67,84 67,8%. 
30 +- 20 
Средняя арифметическая — одна из основных характеристик 
варьирующих объектов. Она обладает рядом важных свойств. 
1. Если каждую варианту статистической совокупности 
уменьшить или увеличить на некоторое произвольно взятое по- 
ложительное число А, то и средняя уменьшится или увеличит- 


ся на это число. у д Ауу 
— (х; А) Л 71 у: -— 
Доказательство: о: Уи — АХ! =х-—А. 


УЛ п У! 


Отсюда #==х*-4-А., Это означает, что среднюю Х можно вычис- 
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лять по уменьшенным на А членам выборки, прибавив к полу- 
ченной величине вычтенное из вариант число А. 

Пример 2. Имеются следующие шесть вариант: 7, 9, 15, 10, 
11, 8. Средняя == (1/6) (7--9-- 15-104 11-8) = 60/6 = 10. Выч- 
тем из каждой варианты А=7 и вычислим среднюю арифме- 
тическую: х* ВЕНА: == = 3, Прибавив к этой ве- 
личине А=7, получим &=3--7==10. 

2. Если каждую варианту разделить или умножить на какое- 
либо одно и то же число А, то средняя арифметическая изме- 
нится во столько же раз. 


Доказательство: х = ==. Это свой- 


ство позволяет вычислять среднюю Х упрощенным способом, 
предварительно уменьшив каждую варианту в А раз, а затем 
умножив полученный результат на А, т. е. Х==Х*. 

Пример 3. Разделим каждую варианту данной совокупности 
на 2 и вычислим среднюю арифметическую: 


2*== (1/6) (3,5-4,5 7,5-- 5,0-5,5 4,0) =30/6==5. 


Умножив полученную величину на А==2, находим х==5:2=10. 
3. Сумма произведений отклонений вариант от их средней 
арифметической на соответствующие им частоты равна нулю‘. 
Доказательство: У |7, (х, —– х)]= У 5х; – ХУ ХИ — хл). 
Пример 4. Выше найдено, что средняя из совокупности шес- 
ти вариант — 7, 9, 15, 10, 11 и 8— равна 10. Определим сумм 
отклонений вариант от этой средней: (7—10) +4- (9—10) +4- (15— 
=—10) 4- (10—10) - (11—10) +- (8—10) =—6-6==0. 
4. Сумма квадратов отклонений вариант от их средней х 
меньше суммы квадратов отклонений тех же вариант от лю- 
бой другой величины А, не равной х, т. е. 


у(х х) < У(Х АЯ. 

Пример 5. Найдем сумму квадратов отклонений каждого 
члена данной совокупности от их средней х, равной 10: У (х;— 
в (7—10)*- (9—10)24-(15—10)2-- (10—10) "+ (11—10)? + 

4+ (8—10)? ==94-14-254-14-4= 40. Теперь отыщем сумму квад- 
ратов отклонений тех же вариант от А, равного 8: (7—8)24- 
1 (9—8)2--... 4- (8—8) 264. 

Рассмотренные свойства средней арифметической позволя- 
ют преобразовывать многозначные и дробные числа, что облег- 


`1 Под отклонением понимают разность между отдельными вариантами и 
их средней величиной, т, е, (Х:—х), 
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чает работу по вычислению статистических характеристик (см. 
табл. 9). 

Средняя гармоническая #һ. Эту характеристику в отличие 
от средней арифметической, представляющей сумму вариант, 
отнесенную к нх числу, определяют как сумму обратных зна- 
чений вариант, деленную на их число. Для определения прос- 
той и взвешенной средней гармонической применяют формулы 


(76) 


Я УРЕН иав 

= Уау (78) 8 % = УИ 
в которых и — число произведенных наблюдений; х; — значения 
вариант; {+ — частоты. 

Чтобы уяснить суть средней гармонической, удобнее начать 
с рассмотрения соответствующих конкретных данных. 

Пример 6. Пять доярок в течение 1 ч (60 мин) надоили 
следующее количество молока: первая — 10 л, вторая — 20, 
третья — 25, четвертая — 30 и пятая —20 л; всего 105 л за 1 ч. 
Оценим эти итоги с помощью Х и &һ. Получим следующие ре- 
зультаты: х= (10--20--25--30--20):5=21 л; 

> 5 5 


= ло 20 + 1/25 + 11304120 = 0,073 


Разница между х и хь весьма заметна. Какая же из этих 
средних верна? Возвращаясь к примеру, можно отметить, что, 
используя х, можно легко определить общее количество надоен- 
ного пятью доярками молока: 21.5==105 л. Попробуем с по- 
мощью Х вычислить время, затраченное в среднем одной дояр- 
кой на выдаивание 1 л молока. Получим результат: 60/21= 
=—2,86 мин/л. Верно ли это? Проверим результат: первая до- 
ярка на выдаивание | л молока затратила 60/10==6 мин, вто- 
рая — 60/20=3, третья — 2,4, четвертая — 2, пятая —3 мин. 
В среднем получается (6--3--2,4--2--3) /5==16,4/5 =3,38 мин/л. 
Видно, что средняя арифметическая непригодна для определе- 
ния среднего времени, затрачиваемого на выдаивание | л мо- 
лока. Другой результат получается с применением средней гар- 
монической: 60:18,31 =3,28 мин/л. Это точный результат. 

Из приведенного примера видно, что средняя гармоническая 
применяется тогда, когда результаты наблюдений обнаружива- 
ют обратную зависимость, заданы обратными значениями ва- 
риант. 

Средняя квадратическая Ха. Для более точной числовой ха- 
рактеристики мер площади применяется средняя квадратиче- 
ская. Этот показатель вычисляют по формулам 


Я или при повторяе- Уля 
2 х 5 Р 
Х = у (8а) мости отдельных у — ү .. (86) 
ь в вариант 2 п 
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Пример 7. Измеряли площадь корзинок у десяти наугад 
отобранных растений подсолнечника. Результаты измерений 
распределились следующим образом: 


Площадь корзинок х+, 6 90 95 130 175 200 220 
Чнсло случаев ѓ; .. . 1 2 3 2 1 


Определим средний размер этого признака. Предваритель- 
но находим ХУ (ј:х;:2) ==1:5024-1-:9524-2-. 13024-3: 17524-2. 2002 +- 
4-1:2202= 265 600. Отсюда х.=265 600/10= 163,0 см?. Средняя 
арифметическая в таких случаях оказывается меньше средней 
квадратической: = (1:50 +- 1:95 4 2:130 - 3-175 + 2:200 +- 
1.220) /10==1550/10==155 см?. 

Средняя кубическая хо. В качестве характеристики объем- 
ных признаков более точной является средняя кубическая, опре- 
деляемая по формулам 


| 3 или при повторяе- 3 ‚ хз 
ла ү 2 (9а) мости отдельных г Е (96) 
ав п вариант о п 
Пример 8. Измеряли объем наугад отобранных 18 куриных 


яиц (учитывали полусумму большого и малого диаметра). Ре- 
зультаты измерений оказались следующими: 


Днаметр янц х;, см... ... 47 48 5,0 54 56 60 
Число случаев ў... .... 8 4 6 3 2 1 


Определим средний объем яиц по их диаметрам. Предвари- 
тельно вычислим 
Уз =2(4,7)3-|-4(4,8)3-|-6(5,0}8-|-3 (5,4) 4-2 (5,6) 4- 1 (6,0) 
==2419,638. 
Отсюда Хо = 2419,68818=У 184,42 =5,12. 


Средняя геометрическая х,. Этот показатель представляет 
собой корень п-й степени из произведений членов ряда Х;== 


у. ХХХ... Хь, где п — объем совокупности; при этом х:2>0. 
Так, средняя геометрическая чисел 5, 8 и 25 равна 
х, = 0 5:8:95— у 1000—10. 


Обычно среднюю геометрическую вычисляют с помощью де- 
сятичных логарифмов по следующим рабочим формулам: 


Е 1 | 
10, == х 81; (10) 
Е 1 { 
Ера Баа (11) 
о жж 
Е. (12) 
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рормулу (10) применяют для вычисления средней геометриче- 
зкой из абсолютных прибавок величины признака; формула 
11) служит для вычисления средней геометрической из относи- 
ельных прибавок величины признака за равные промежутки 
зремени, а формулу (12) используют для вычисления средней 
еометрической по разности между конечной хк и начальной хн 
рибавками величины признака. 

Пример 9. По данным Дональдсона, масса тела лаборатор- 
ых мышей изменялась с возрастом следующим образом 
табл. 8). 


Таблица 8 
Прибавки массы тела Логарифм прибавок 
зонах за одну неделю, г массы тела 
мышей, Масса тела, Г 
нед. аб относитель- б относитель- 
солютные ные абсолютиых ных 
1 10 ее НР — = 
2 15 5 1,50 0,69897 0,17609 
3 20 5 1,33 0,69897 0,12385 
4 27 7 1,35 0,84510 0,13033 
5 35 8 1,30 0,90309 0,11394 
6 46 11 1,31 1,04139 0,11727 
7 58 12 1,26 1,07918 0,10087 
8 72 14 1,24 1,14613 0,09342 
9 87 15 1,21 1,17609 0,08279 
Сумма — 77 10,50 7,58892 0,93806 


Определим среднюю геометрическую из абсолютных недель- 
ых прибавок массы тела мышей за первые девять недель их 


кизни: [0 хр Е == (),95861,откуда Х;==8,9 г. Средняя гео- 


1етрическая из абсолютных прибавок массы тела мышей ока- 
зывается меньше средней арифметической: х==77/8==9,6 г. Так 
‹ак средняя геометрическая характеризует ряды динамики, 
бычно ее вычисляют не из абсолютных, а из относительных 
трибавок величины признака за определенные равные проме- 


– 0,93806 
кутки времени. Например, в данном случае је х, = с =н 


=0,11726, откуда == 1,310 г. Средняя арифметическая из от- 
„ — 0,50 
‘осительных прибавок массы тела мышей х = 30 = 1,313 гі. 


! Если собранные данные распределяются в интервальный варнационный 
‚яд, среднюю геометрическую определяют по центральным значенням клас- 
овых интервалов, как и другие степенные средние, 
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Когда известны лишь два крайних значения изменяющегося 
во времени признака: начальная (базисная) и конечная вели- 
чины, — среднюю геометрическую вычисляют по формуле (12). 
Так, применительно к рассматриваемому примеру начальная 
Хн==10 и конечная хк=87, откуда среднюю геометрическую 
рассчитывают следующим образом: 


16 х, == (1/8) (16 87--16 10)==(1/8) (1,93952 — 1,000)==0,11744, 


или Х:=1310 г — величина, которая была получена выше. 

Пример 10. По данным М. А. Ольшанского (1950), в резуль- 
тате пятилетнего отбора (1936—1940) длина волокна у гибрид- 
ного сорта хлопчатника увеличилась с 26,3 до 31,0 мм. Опреде- 
лим по формуле (12) среднегодовой эффект селекции этого 
признака: 


1ех,=(15) (16 31,0 — 16 26,3)=0,01428. 


Отсюда #,= 1,0334 мм, что составляет 3,9% от начальной 
(базисной) величины (26,3) этого признака. 

Средняя геометрическая — более точная характеристика ря- 
дов динамики, чем средняя арифметическая. В этом можно 
убедиться, если последовательно перемножить средний прирост 
величины признака за учитываемый период времени начиная с 
базисной величины. Так, в рассмотренном примере 9 конечную 
величину признака (хк=87 г) находят в результате следующе- 
го расчета: 10,1,310.1,310.1,310.1,310.1,310.1,310-1,310.1,310Ж 
Х 1,310=87. Проверим этим способом точность средней арифме- 
тической (х=1,313): 10.1,313.1,313.1,313.1,313.1,313* 1,313 х 
Ж1,313. 1,313 =88,3, При сравнении первого результата со вто- 
рым видно, что средняя геометрическая более точно характери- 
зует динамику явления, чем средняя арифметическая. 

Однако средняя геометрическая, как правило, незначительно 
отличается по величине от средней арифметической. К тому же 
вычисление средней арифметической проще, чем средней гео- 
метрической. Поэтому вместо средней геометрической в качест- 
ве приближенной характеристики темпов динамики нередко ис- 
пользуют среднюю арифметическую. При этом приходится учи- 
тывать и то, что средняя геометрическая дает хорошие (не иска- 
женные) результаты лишь при наличии геометрической прогрес- 
сии, заложенной в самой динамике явления, Это обстоятельство 
несколько ограничивает область применения средней геометри- 
ческой, которую вычисляют обычно в прогностических целях и 
при определении средних прибавок массы или размеров тела, 
возрастных изменений численного состава популяций за опре- 
деленные (обычно равные) промежутки времени. 

В заключение обзора степенных средних необходимо отме- 
тить, что между ними существуют определенные соотношения, 
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выражаемые следующим рядом мажорантности (неравенства): 
ГЕ 


1.2. ПОКАЗАТЕЛИ ВАРИАЦИИ 


Средние величины не являются универсальными характери- 
стиками варьирующих объектов. При одинаковых средних при- 
знаки могут отличаться по величине и характеру варьирования. 
Поэтому наряду со средними для характеристики варьирующих 
признаков используют и показатели вариации. Одним из таких 
показателей являются лимиты (от лат. 1ітеѕ — предел), обозна- 
чаемые символом 11т. В биометрии под этим термином понима- 
ют значения минимальной Хи И максимальной хшах вариант 
совокупности. 

Размах вариации К. Это показатель, представляющий собой 
разность между максимальной и минимальной вариантами со- 
вокупности, т. е. Ю==Хшах-—Хпит. Чем сильнее варьирует признак, 
тем больше размах вариации, и, наоборот, чем слабее вариация 
признака, тем меньше будет размах вариации. 

Лимиты и размах вариации — простые и наглядные характе- 
ристики варьирования, однако им присущи существенные недо- 
статки: при повторных измерениях одного и того же группового 
объекта они могут значительно изменяться; кроме того, они не 
отражают существенные черты варьирования, что можно пока- 
зать на следующем примере. 

Возьмем два ряда распределения с одним и тем же весом 
входящих в их состав вариант, равиым единице: 


хі 10 15 20 25 30 35 40 45 50 д, =30 
Хо 10 28 28 30 30 30 32 32 50 я.=30 


По числу вариант (п=9), лимитам и размаху вариации эти 
ряды не отличаются друг от друга; их средние также равны 
между собой. Отличает их друг от друга характер варьирова- 
ния, но эта особенность никак не отражается на лимитах и раз- 
махе вариации. 

Более удобной характеристикой вариации мог бы служить 
показатель, который строится на основании отклонений вариант 
от их средней, т. е. |х:—#|==4. Сумма таких отклонений, взя- 
тая без учета знаков и отнесенная к числу наблюдений п, назы- 


вается средним линейным отклонением д яя, Так, 
у п 


если взять суммы отклонений вариант от их средней (х==30) 
для первого х1 и второго хз приведенных здесь рядов, то полу- 
чаются следующие результаты: 


4, =20 15 10 5 0 5 10 15:20 ХУ = 100 
= 20 220002220 ў4,=48 


Отсюда 2,==100/9==11,1 и 42==48/9==5,3. Таким образом, в пер- 
вом случае варьированне сильнее, чем во втором. 

Дисперсия и ее свойства 5°, 0. Несмотря на явное преиму- 
щество среднего линейного отклонения перед лимитамн и раз- 
махом варнации, этот показатель не получил широкого приме- 
нения в биометрии. Наиболее подходящим оказался показатель, 
построенный не на отклонениях вариант от их средних, а на 
квадратах этих отклонений, его называют дисперсией (от лат. 
діѕрегѕіо — рассеяние!) и выражают формулами 


А Е 
оо ея) Ул х)2 
55 = агъа или а ————, (13) 


А 
где х — знак суммирования произведений отклонений ва- 
Тет 


рнаит х; от их средней х на весі или частбты ѓ; этих отклоне- 
ний в пределах от первого до Ё-го класса; п — общее число на- 
блюденнй. Иидекс х у символа дисперсин обозначает, что этот 
показатель характеризует варьирование числовых значений 
признака вокруг их средней величины. 

Ценность дисперсии заключается в том, что, являясь мерой 
варьирования числовых значений признака вокруг их средней 
арифметической, она измеряет и внутреннюю изменчивость зна- 
чений признака, зависящую от разностей между наблюдениями. 
Преимущество дисперсии перед другими показателями вариа- 
ции состоит также и в том, что она разлагается на составные 
компоненты, позволяя тем самым оценивать влияние различных 
факторов на величину учитываемого признака. 

Вместе с тем установлено, что рассчитываемая по формуле 
(13) дисперсия оказывается смещенной по отношению к своему 
геиеральному параметру на величину, равную и/ (п—1). Чтобы 
получить несмещенную дисперсию, нужно в формулу (13) вве- 
сти в качестве множителя поправку на смещенность, иазывае- 
мую поправкой Бесселя. В результате формула (13) преобразу- 


'Р. Фишер иазвал эту характеристику «вариаисой» (от аигл. уагіапсе — 
изменение) вместо математического термииа «дисперсия», который биомет- 
рики (Н. А. Плохинский, 1970; и др.) стали применять для обозначения сум- 
мы квадратов отклонений. Так возник разнобой в терминах математики и био- 
метрии, что весьма нежелательно. Чтобы избежать указаниого разнобоя в на- 
стоящем руководстве не делается различия между термииами «варианса» и 
«дисперсия», под которыми понимают средиий квадрат отклоиеиий, а для 
обозиачения суммы квадратов отклоиеиий вводится предложенный Дж. Юлом 
и М. Кендэлом (1960) термин «девиата» (от лат, демаНо — отклоиеиие от че- 
го-либо), 
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‘ется следующим образом: 


В Е 
У у(х: х)? п У (хх) 
а, (14) 
п п— 1 п— 1 


Разность и —1, обозначаемую в дальнейшем строчной буквой 
латинского алфавита А, называют числом степеней свободы, под 
которым понимают число свободно варьирующих единиц в со- 
ставе численно ограниченной статистической совокупности. 

Так, еслн совокупность состоит из п-го числа членов и ха- 
рактеризуется средней величиной Х, то любой член этой сово- 
купности может иметь какое угодно значение, не изменяя при 
этом среднюю х, кроме одной варианты, значение которой опре- 
деляется разностью между суммой значений всех остальных 
вариант и величиной их. Следовательно, одна варианта числен- 
но ограниченной статистической совокупности не имеет свободы 
вариации. Отсюда число степеней свободы для такой совокуп- 
ности будет равно ее объему п без единнцы, т. е. Ё=и—1. 
А при наличии не одного, а нескольких ограничений свободы ва- 
риации число степеней свободы вариации будет равно &==7—%, 
где у (греческая буква ню) обозначает число ограничений сво- 
боды вариации. 

Дисперсня обладает рядом важных свойств, из которых не- 
‚ обходимо отметить следующие, 

1. Если каждую варнанту совокупности уменьшить или уве- 
‘личить на одно и то же постоянное число А, то дисперсия не 
изменится: 


І 
п — 1 


У А) (8 А) 1 У Я. 


$ 
5; == 


Пример 11. Рассмотрим вновь совокупность, состоящую из 
шести вариант: 7, 9, 15, 10, 11, 8. Характеристики этой совокуп- 
ности 2==10 и 5,2==8. Уменьшим каждую варианту на шесть 
„единиц и вычислим дисперсию: р 


рет 1 К) 9 4 5 2 Х*—=24/6=4 
м2") 3—1 +45 0 +1 —2 Ў 
У (х1--х*)? 40 
—*)2 Залы Зы ИЕ 8 
(х:—2*) 91 250 14 1 5 8 


Отсюда следует, что дисперсию можно вычислить не только 
по значениям варьирующего признака, но и по их отклонениям 
от какой-либо постоянной величины А. 

2. Если каждую варианту совокупности разделить или ум- 
ножить иа одно и то же постоянное число А, то днсперсия 
‚уменьшится или увеличится в А? раз. 
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Доказательство: 
2 І х х \? 1 - 
1-4) е атр 04—893 
А также 52== —1— У (х,А д = У (х, — х)? 2. 
Пример 12. Проиллюстрируем это свойство на том же при- 
мере. Разделим каждую варианту на 2, т. е. 7/2==3,5; 9/2= 


== 4,5 и т. д. и вычислим дисперсию для совокупности умень 
шенных вдвое вариант; 


х] 35 45 75 50 55 40 #3065 
(я =*) —15 —05 +25 0 +05 10 
(=)! 995 0,25 6525 0 0,55 10 2-10/5=9 


Из этого свойства следует, что при наличии в совокупносте 
многозначных вариант их можно сократить на какое-то постояв 
ное чнсло А и по результатам вычислить дисперсию. Затем пс 
лученную величину умножить на квадрат общего делителя А: 
что и даст искомую величнну дисперсии. Так, в данном случае 

_ 5х2 ==2.22=8. 

На основании математических свойств средней арифметиче 
ской и дисперсии нетрудно составить сводку правил по преобра 
зованию многозначных и дробных чисел, которую полезно и 
пользовать при обработке биометрических данных (табл. 9). 


Таблица =, 
Способы Какие поправки иужио внести в конечные результаты 
преобразо- 
вания 
чнсел при вычислении дисперсии средией арифметической 
х—А Поправка не нужна Прибавить число А 
(х—А)К Разделить иа А? Разделить на А и прибавить 
число А 
(х—А)/К |Умножить на К? Умиожить иа К и прибавить 
число А 
х/К Умиожить иа 42 Умиожить иа А 
ХА Разделить иа А? Разделить на А 


В этой таблице А — произвольно взятое число, обычно близ- 
кое к величине минимальной варианты хХпіп; К — произвольноє 
число, позволяющее преобразовывать дробные числа; х — о" 
дельные числовые значения признака, т. е. варианты. 

Следует также иметь в внду, что вместо Ў (х:-—Х)2 можн‹ 
использовать 


У т, [2 ви 1 Ул — пл. 


п п 
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Отсюда можно вывести следующие рабочие формулы, удобные 
при вычислении дисперсии непосредственно по значениям 
варьирующего признака: 


1 В 
2-р 22 оз 
{ = 
= -т(Ум их); (16) 
9 
П. Б _ ни, (17) 
п — 1 п п 
или при повторяемости отдельных вариант 
Л 2 (1:0? 1, . 
нхл ВА] (18а) 
= (А и), (16а) 
2 ‚ 
ое Б Еа ССА, (17а) 
п — 1 п п 


Среднее квадратическое отклонение 5х. Наряду с диспер- 
сией важнейшей характеристикой варьирования является сред- 
нее квадратическое отклонение — показатель, представляющий 
корень квадратный из дисперсии: 


$ ‚И 292 хи. (18) 


п — 1 


Эта величина в ряде случаев оказывается более удобной харак- 
теристикой варьирования, чем дисперсия, так как выражается в 
тех же единицах, что и средняя арифметическая величина, 

Дисперсия и среднее квадратическое отклонение наилучшим 
образом характеризуют не только величину, но и специфику 
Варьирования признаков. Чтобы убедиться в этом, вернемся к 
рассмотренным выше рядам распределения, у которых одинако- 
вый размах вариации и одинаковые средние показатели, но раз- 
личный характер варьирования, и вычислим для них дисперсию 
и среднее квадратическое отклонение: 


х 10 15 20 5 30 35 40 45 50 #=30 

та —20 —15 —10 —5 0 +5 +10 +15 +20 

2)? 400 225 100 25 0 25 100 225 400 Х(х:-—)?== 
=1500 


Отсюда 5:2 =1500/ (9—1) =187,5 и ѕ,=/ 187,5==13,7. 
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#2 10 28 28 30 30 30 32 32 50 2.=30 

(хе) —20 —2 —> 0 0 0 +2 +2 +20 

(х:—2)2 400 4 4 0 0 0 4 4 400 $(ж-—2)2= 
=816 


Отсюда 5х? ==816/8==102 и $,=У 102==10,1. 

Из приведенных вычислений видно, что при одинаковых ли- 
митах и размахе вариации дисперсия и среднее квадратическое 
отклонение оказались неодинаковыми: на величине этих показа- 
телей сказался различный характер варьирования признаков. 

Поправка Шеппарда. При превращении интервального ва- 
риационного ряда в безынтервальный ряд частоты распределе- 
ния относят к средним значениям классовых интервалов без 
учета внутриклассового разнообразия. Между тем варианты 
внутри классов распределяются неравномерно, накапливаясь 
больше у тех границ, которые ближе к средней арифметической 
ряда. Отсюда следует, что при вычислении обобщающих харак- 
теристик для непрерывно варьирующих признаков допускают 
систематическую погрешность, величина которой зависит от ши- 
рины классового интервала: чем шире интервал, тем больше и 
погрешность. На величине средней арифметической погрешность 
отражается слабо, тогда как на величине дисперсии она сказы- 
вается более сильно. Учитывая это обстоятельство, В. Шеппард 
(1898) установил, что разность между расчетной и фактической 
величиной дисперсии составляет '/1› квадрата классового интер- 
вала. Следовательно, при вычислении дисперсии по формуле 
(13) следует вносить поправку Шеппарда, т. е. вычитать эту 


1 
величииу (> №) из 5,2. Так, если взять распределение каль- 


ция (мг%) в сыворотке крови обезьян, для которого известны 
5;2== 1,60 и 5;=1,26, то, учитывая ширину классового интервала 
А—=0,8 мгф и внося поправку Шеппарда, получим 5,2=1,60— 


—0,82/12==1,55 и 5,== 1,55 ==1,24. 

Поправка Шеппарда вносится далеко не всегда. Ее обычно 
применяют или при высокой точности расчетов, или при нали- 
чии большого числа наблюдений (п>500), распределяемых в 
ннтервальный вариационный ряд. Для получения обобщающих 
числовых характеристик небольших и средних по объему (п< 
<500) совокупностей поправку Шеппарда не вносят. 

Коэффициент вариации У, Су. Дисперсия и среднее квадра- 
тическое отклонение применимы и для сравнительной оценки 
одноименных средних величин. В практике же довольно часто 
приходится сравнивать изменчивость признаков, выраженных 
разными единицами. В таких случаях нспользуют не абсолют- 
ные, а относительные показатели вариации. Дисперсия и сред- 
нее квадратическое отклонение как величины, выражаемые теми 
же единицами, что и характеризуемый ими призиак, для оцеики 
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нзменчивости разноименных величин непригодны. Одним из 
относительных показателей вариации является коэффициент 
вариации. Этот показатель представляет собой среднее квадра- 
тическое отклонение, выраженное в процентах от величины 
средней арифметической: 


Со== “= 100%. (19) 


Пример 13. Сравнивают два варьирующих признака. Один 
характеризуется средней Х,==2,4 кг и средним квадратическим 
отклонением 51=0,58 кг, другой — величинами #;==8,3 см и 
52==1,57 см. Следует ли отсюда, что второй признак варьирует 
сильнее, чем первый? Нет, не следует, так как среднее квадра: 
тическое отклонение определяют по отклонениям от средних, а 
они различны по величине. Кроме того, не вполне корректно 
сравнивать величины, выраженные разными единицами меры. 
Именно поэтому в подобных случаях уместно использовать без- 
размерные значения коэффициентов вариации. Сравнивая их в 
приводимом примере, находим, что сильнее варьирует не вто- 
рой, а первый признак: 


Соз = 100(0,58/2,4) = 24,2 % и Со,== 1006(1,57/8,3) 18,9 %. 


Различные признаки характеризуются различными коэффи- 
циентами вариации. Но в отношении одного и того же призна- 
ка значение этого показателя Со остается более или менее 
устойчивым и при симметричных распределениях обычно не пре- 
вышает 50%. При сильно асимметричных рядах распределения 
коэффициент вариации может достигать 100% и даже выше. 
'Варьирование считается слабым, если не превосходит 10%, 
средним, когда Со составляет 11—254, и значительным при 

025%, 

Применяя коэффициент вариации в качестве характеристики 
варьирования, следует учитывать единицы размерности изучае- 
мого признака: линейные или весовые (объемные). Акад. 
И. И. Шмальгаузен (1936) отмечал, что в таких случаях коэф- 
фициент вариации оказывается неодинаковым. Иллюстрацией 
тому могут служить данные Ю. Г. Артемьева (1939), исследо- 
вавшего варьирование величины внутренних органов у малых 
сусликов в зависимости от того, какими единицами меры выра- 
жены признаки (табл. 10). 

Данные, приведенные в табл. 10, показывают, что при линей- 
Ном выражении величины признака коэффициент вариации ока- 
зывается примерно в три раза меньше, чем при кубическом вы- 
ражении того же признака. Причина такого явления — в мате- 
матических свойствах Со, которые надо учитывать, чтобы избе- 
жать возможных ошибок. 
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Таблица 1г 


р ——————— 
Коэффициент вариации при разном 
выражеини призиаков 


Органы 
линейном кубнческом 
Сердце 3,4 10,2 
Легкне 9,6 29,5 
Селезенка 9,8 29,8 
Почка 3,1 9,4 
Печень 3,0 9,3 


Нормированное отклонение #. Отклонение той или иной ва- 
рианты от средней арифметической, отнесенное к величине 
среднего квадратического отклонения, называют нориирован- 
ным отклонением: 


= 15), (20 


5х 


Этот показатель позволяет «измерять» отклонения отдельны: 
вариант от среднего уровня и сравнивать их для разных приз 
наков. 

Пример 14. При обследовании группы подростков в возра 
сте от 15 до 16 лет установлено, что средний рост юношей ха 
рактеризуется следующими показателями: х==164,8 см и 5;= 
==5,8 см. В группе оказался юноша, рост которого раве 
172,4 см. Спрашивается: как велико отклонение роста этог‹ 
юноши от средней величины данного признака в этой группе 
172,4 — 164,8 


Нормируя рост юноши (#==172,4), находим #= са 


== -|- 1,81. 

Получая значения нормированных отклонений для разны 
признаков, можно сравнить места, занимаемые особью, индивь 
дом и т. п. по каждому из этих признаков в их распределени 
ях. Пусть, например, нормированное отклонение у рассматри 
ваемого юноши по ширине плеч равно — 0,41. Тогда можно ут- 
верждать что у него длина тела отклоняется от средней в сто 
рону больших величин этого признака, а ширина плеч — в сто- 
рону малых, т. е. характерен относительно узкоплечий тип те 
лосложения. 

Нормированное отклонение используют также при работе : 
так называемым нормальным распределением. 


1.3. СПОСОБЫ ВЫЧИСЛЕНИЯ СТЕПЕННЫХ СРЕДНИХ 
И ПОКАЗАТЕЛЕЙ ВАРИАЦИИ 


Моменты распределения. Средние величины и показатели ва- 
риации вычисляются как на группированном, так и негруппиро- 
ванном в вариационные ряды исходном материале. Известны 
три основных способа вычисления обобщающих числовых ха- 
рактеристик: способ произведений, способ условной средней и 
способ сумм или кумулят. Каждый способ имеет свои конструк- 
тивные особенности, но любой из них приводит к одному и 
тому же конечному результату. 

Чтобы раскрыть сущность каждого способа и облегчить по- 
нимание конструктивных особенностей других обобщающих по- 
казателей, с которыми придется встречаться в дальнейшем, не- 
обходимо познакомиться с понятием статистических моментов, 
или моментов распределения. 

Моментами распределения называют суммы отклонений ва- 
риант х; от какого-либо числа А, возведенные в А-ю степеиь и 
отнесенные к общему числу вариант п, составляющих данную 
совокупность. Иными словами, это величины, которые можно 
выразить в виде следующей общей формулы: 


М= —- Хи, А». 


Если отклонения вариант вычисляют по отношению к нуле- 
вой точке, то моменты называют начальными (т); если от 
средней арифметической, то моменты называют центральными 
и обозначают греческой буквой р (ми). Если же отклонения 
вариант находят от произвольно выбранного числа А, моменты 
называют условными (5). В зависимости от степени отклоне 
ний статистические моменты подразделяют на моменты перво- 
го, второго и больших порядков. В области биометрии исполь 
вуют обычно моменты первого, второго, третьего и четвертого 
порядков. Формулы для их вычисления приведены в табл. 11. 

Центральные моменты ряда распределения связаны с ус- 
ловными моментами следующим образом: 


=, — в, ==0; 
роб — бр 6%; 
ваъ — ЗБ, 267; 
м == р, == 46.6; + 6625, =" Зр. 


Эти формулы используют при вычислении обобщающих ха- 
рактеристик вариационного ряда. ПА замене в этих форму- 
лах обозначений условных моментов 6; на начальные т; можно 
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Таблица 1. 


распреле- Начальные Центральные Условные 


У 7 (х — 0) я УЛ - А) 
ервого по- 1 = раан һ= 270-0 ааа 
ядка 
рядк Х/к 
п 
_ 1—0) _ лия) | ХА) 
Второго по- Б п Е Е — 2 = ра 
рядка ууа 
п 
_ ХЛ (а -— 0 _ у(х) |, ХЛ А 
Третьего по-| 3 — п с 15 оета п 
рядка улаз 
п 
_ али _ лая |, ХЛ А) 
Четвертого 4 л Г ме в я 
порядка БУЛ 
п 


получить выражения для вычисления центральных моментов 

Способ произведений. Основу этого способа составляет на- 
хождение отклонений вариант от средней величнны, характерн- 
зующей данную статнстическую совокупность. Каждое отклонє- 
ние возводится в степень, затем эти степени отклонений сумми 


руются. В простейшем виде эта операция записывается так: 
п 


п 
Ў (а-я = Ух ай, 
{=1 1=1 л 
В совокупности варианты обычно повторяются, поэтому сум 
мы отклонений вариант от средней должны умножаться на и: 
веса или частоты (отсюда и название способа), т. е. рассчите. 
ваться по взвешенным суммам квадратов отклонений (девиат) 


(2 В 
== 2 
Е (х, х)? = оё лы». 
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Пример 15. По данным Г. Е. Бодренкова (1963), длина тела 
у личинок щелкуна, отобранных случайным способом в посеве 
озимой ржн и нзмеренных в миллиметрах, варьировала сле- 
дующим образом: 7, 10, 14, 12, 15, 16, 12. Средняя длнна лн- 
чинок == (1/7) (7--10--14--... 12) =86/7=12,3 мм. Чтобы 
определить показатели вариации, предварительно находим: 


ж 7 10 14 12 15 16 12 Ух: =86 
хі? 49 100 196 144 225 256 144 Уха 1114 


Отсюда значение девиаты Р = 1114—862/7= 57,43. Показатели 
= = —9,57; 5„—=9,57—=3,094 и коэффицн- 


ент варнации С,= 00209 = 24,2%. 


`вариацин $2== 


Пример 16. Определить среднее число поросят в пометах 
64 свиноматок (см. гл. 1) и вычислить показатели вариации 
для этого распределения. Предварительно рассчитаем вспомо- 
гательные величины Ух’, Урх; и Хј;х;?. Расчет проводится в 
табл. 12. 


Таблица 12 


Классы 
ы: 


5 4 
6 7 
7 13 
8 15 
9 7 
10 9 
11 6 
12 3 
Сумма 64 — 528 4574 


Подставляя найденные велнчины в формулы, имеем #== 
528/64-==8,25 поросят; а (4574 ся а. —=3,46;8, 


1,86 
| ==100 —— =22,5%. 
ах 1,85 и Со=100 8 5 ‚5% 
_ Пример 17. Годовой удой 80 коров, содержащихся на ферме, 
распределился следующим образом: 
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Удой, кг 2500—2600—2700—2800—2900—3000—3100—3200—3300 
Число коров 2 5 13 20 16 17 4 3 


Вычислить характеристики для этого ряда. Предварительно 
превратим интервальный ряд в безынтервальный: 2550 2650 
2750 2850 и т. д. Чтобы облегчить вычислительную работу, 
уменьшим каждую классовую варианту на А=2500 и разделим 
полученную величину на К=10. По преобразованным значе- 
ниям классов:  (2550—2500):10=5;  (2650—2500):10=15; 
(2750—2500) :10==725 и т. д.— рассчитываем вспомогательные 
величины (табл. 13). 

Подставляя известные величины в формулы с учетом тех 
поправок, которые внесены в данном случае (см. табл. 9), на- 


ходим: = ХИ К Ани =" 10-2500 2906,95 кг; 
п 
21 0 (л (18 500 — 32502 \ 12 
= [хл п к — 79 80 о = 
=(151 400 — 132 031,25)/79 =1 936 875/79 =24517,40; $,== 
УТ 156,58 
== |/ — = о — 54, 
и 4517,40 =156,58 и С, = 100 5906 25 4% 
Таблица 13 
Преобразован- 
ия | Часты п т по 
хц 
5 2 10 25 50 
15 5 75 225 1125 
25 13 325 625 8125 
35 20 700 1225 24500 
45 16 720 2025 32400 
55 17 935 3025 51425 
65 4 260 4225 16900 
75 3 225 5625 16875 
Сумма 80 3250 = 151400 


Способ условной средней. Нельзя не заметить, что вычисле- 
ние статистических характеристик способом произведений, осо- 
бенно при наличии многозначных чисел, представляет собой 
трудоемкий процесс. Гораздо легче рассчитать статистические 
характеристики упрощенным способом условной средней, назы- 
ваемым также способом условного нуля. Суть этого способа за- 
ключается в следующем. 

Одну из вариант условно принимают за среднюю величину, 
обозначив ее через А. Обычно в качестве условной средней, или 
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нулевой точки отсчета, берут варианту или класс с наиболь- 
‚шей частотой, хотя это и не обязательно: в качестве условной 
‘средней можно принять любую варианту (при наличии негруп- 
пированных данных) или любой класс вариационного ряда. На- 
метив величину А, остается найти поправку, которую необхо- 
чимо прибавить или вычесть (смотря по знаку) от условной 
средней, чтобы получить значение средней арифметической х. 
Такой поправкой служит условный момент первого порядка 
5 = УЛ (х: А) 


(см. табл. 11). Обозначив отклонения вари- 
п 


У7:а 
п 


ант от условной средней через а, получим ё; = Отсюда 


формула для определения средней арифметической 
х= А 20. (21) 


Дисперсия, определяемая этим способом, равна разности 
между условным моментом второго и квадратом условного 
момента первого порядка, умноженной на величину п/(п—1), 
хоторая называется поправкой Бесселя: 


п / 
л! (22) 
В развернутом виде эта формула выглядит так: 
Е 21 2 (7а) 
х бета 7 [57а = | или (23) 
+ 52== п Ба г Уа 1 (24) 
п! л п 


Ниже приведены конкретные примеры применения этих фор: 
мул. 

2 Пример 18. Вычислить способом условной средней основные 
характеристики ряда распределения кальция (мг%) в сыворот- 
же крови обезьян. Предварительно рассчитываем вспомогатель- 
зые величины УЁа и хра* (табл. 14). 

< В качестве условной средней А взята классовая варианта, 
давная 11,4. От этой величины находим отклонения классов: 
3,0—11,4=-—9.4; 9,8—11,4=—1,6 и т. д. (см. третью графу 
"абл, е Подставляем найденные величины в формулы: 


== 11,44} 53,6/100= 11,936 == 11,94 мг%; 


52 100 хещ 53,6 


Е 100 100 


с == 0 (1,8752 —0,2873) == 1,60. 
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Таблица 1- 


Классы Частоты 


к Г: а=(х.—А) Һа ра? 
1 2 3 а на 

9,0 2 —9,4 —4,8 11,52 
9,8 6 —1,6 —9,6 15,36 
10,6 15 —0,8 —19,0 9,60 
11,4 23 0 0 
12,2 25 -+0,8 20,0 16,00 
13,0 17 +1,6 697,2 43,52 
13,8 7 92,4 -+16,8 40,32 
14,6 5 +3,2 +-16,0 51,20 

Сумма 100 — 53,6 187,52 

т БЕ 
Отсюда 5,=[ 1,60—1,26 и С. 5100 "= 10,6%. 


Вычисление вспомогательных величин можно значительнс 
упростить, если отклонения классовых вариант от условно? 
средней А относить к величине классового интервала, т. е. вме 
то а== (х:—А) брать а=(х:—А)/^. Тогда во всех без исключє 
ния случаях (для равноинтервальных рядов) отклонения клас 
совых вариант от условной средней А, где а=0, превращаются 
в ряд натуральных чисел 1, 2, 3, 4 ит. д., которые, как и в пре 
дыдущем случае, рассматриваются в сторону меньших, чем 2 
значений вариант с отрицательным, а в сторону ббльших, чех 
А, значений — с положитетельным знаком. При этом в форм“ 
лы (21), (23) и (24) вносятся поправки на величину классовог 
интервала: 


ХА М; (25 
Я [хла 22] или (26 
а=" Гале (2ле у. (27 

п — 1 п п 


Применив эти формулы к рассматриваемому примеру, рассчг 
тываем Ура и Ура? (табл. 15). 
Подставляя известные величины в формулы (25) и (26 
находим: 
хо, 0,536 = 11,936 = 11,94 мг%; 


= 


29,2 
„= 


в (298 в") т -9,64 (293 — 44 89) = 219 279 1,60. 
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Таблица 15 


зав е а | Һа | Ра | аз | а 
9,0 2 —3 —6 18 —54 162 
9,8 6 —2 —12 24 —48 96 
10,6 15 —1 —15 15 —15 15 
11,4 23 0 0 0 0 0 
12,2 25 1 25 25 25 25 
13,0 17 2 +84 68 +186 272 
13,8 7 +3 +21 63 +189 567 
14,6 5 +4 +20 80 --320 1280 
Сумма 100 — +67 203 +553 2417 


Две последние графы поиадобятся в дальнейшем (см. разд. 111.10). 


< такому же результату приводит и формула (27): 


2 0,82.100 [ 293 67 \2] 64 
Рес аис сс СВЕТАМ Еа ААА =—=— о — == . 
3 100—1 | 100 ( | 99 (2,98—0,4489)== 1,60 
Пример 19. Обработаем этим способом данные об удоях 80 
‘оров (см. табл. 13). Предварительно рассчитаем вспомога- 
‘ельные величины (табл. 16). 


Таблица 16 
Преобразован- 
ные значення Частоты Ё, Отклонения а ра Га? 
классов х;* 
5 2 —3 —6 18 
15 5 —2 —10 20 
25 13 —1 —13 13 
35 20 0 0 0 
45 16 +1 +16 16 
55 17 +2 +84 68 
65 4 +3 +12 36 
75 3 +4 +12 48 
Сумма 80 — +45 219 


Подставляем найденные величины в формулы (с учетом не- 
'бходимых поправок в связи с преобразованием многозначных 
'исел): 


ха“) К-+-А=(85+ 10 3) 10--2500= 
2406,25 -- 2500=2906,25 кг; 
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М з 0/19)? ] из 102 (о 59) ПИР 
5% РР [хла а ]к = ( 19 7 10 
190 (219. 25,3125) 100—1938875_ _.94517,4 и 
79 79 


5; =24517,4 = 156,58. 


Получился такой же результат, что и выше, а расчет средней 
Я и дисперсии 5х? оказался проще. 


||.4. СТРУКТУРНЫЕ СРЕДНИЕ И СПОСОБЫ 
ИХ ВЫЧИСЛЕНИЯ 


Медиана (Ме). Средняя арифметическа — одна из основных 
характеристик варьирующих объектов по тому или ииому приз- 
наку. Однако она не лишеиа недостатков, так как очень чув- 
ствительна к увеличению числа наблюдений или к уменьшению 
за счет вариант, резко отличающихся по своей величине от ос- 
новной массы. Поэтому на величину средней арифметической 
могут значительно влиять крайние члены ранжированного ва- 
риационного ряда, которые как раз и наименее характерны для 
данной совокупности. В связи с этим во многих случаях в ка- 
честве обобщающих характеристик совокупности более полез- 
ными могут оказаться так называемые структурные средние. 
Эти величины обычно представляют собой конкретиые вариан- 
ты имеющейся совокупности, которые занимают особое место 
в ряду распределения. 

Одной из таких характеристик является медиана — средняя, 
относительно которой ряд распределения делится на две рав- 
ные части: в обе стороны от медианы располагается одинако- 
вое число вариант. При наличии небольшого числа вариант 
медиана определяется довольно просто. Для этого собранные 
данные ранжируют, и при нечетном числе членов ряда цент- 
ральная варианта и будет его медианой. При четном числе 
членов ряда медиана определяется по полусумме двух сосед- 
них вариант, расположенных в центре ранжированного ряда. 
Например, для ранжированных значений признака — 12 14 16 
18 20 22 24 26 28 — медианой будет центральная варианта, 
т. е. Ме=20, так как в обе стороны от нее отстоит по четыре 
варианты. Для ряда с четным числом члеиов — 6 8 10 12 14 16 
18 20 22 24 — медианой будет полусумма его центральных чле- 
нов, т. е. Ме= (144-16) /2==15. 

Для данных, сгруппированных в вариационный ряд, медиа- 
на определяется следующим образом. Сначала находят класс, 
в котором содержится медиана. Для этого частоты ряда куму- 
лируют в направлении от меньших к большим значениям клас- 
сов до величины, превосходящей половину всех членов данной 
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совокупности, т. е. п/2. Первая величина в ряду накопленных 
частот Хч, которая превышает п/2, соответствует медианному 
классу. Затем берут разность между п/2 и суммой накоплен- 
ных частот У}, предшествующей медианному классу, которая 
относится к частоте медианного класса ўме; результат умножа- 
ют на величину классового интервала \. Найденную таким спо- 
собом величину прибавляют к нижней границе хь медианного 
класса. Если же исходные данные распределены в безынтер- 
вальный вариационный ряд, названную величину прибавляют 
к полусумме соседних классовых вариант. В результате полу- 
чается искомая величина медианы. Описанные действия выра- 
жаются в виде следующей формулы: 


2-х 
Ме |, (28) 
ме 


где хн — нижняя граница классового интервала, содержащего 
медиану, или полусумма соседних классов безынтервального 
ряда, в промежутке между которыми находится медиана; >}; — 
сумма накопленных частот, стоящая перед медианным клас- 
сом; [ме-- частота медианного класса; \ — величина классово- 
го интервала; п — общее число наблюдений. 

Пример 20. Вернемся к ряду распределения кальция (мг%) 
" сыворотке крови обезьян и вычислим для него медиану 
табл. 17). 


Таблица 17 
Классы Накопленные 
по содержанию Срединиые звачеиня Частоты частоты 
кальцня классов Р, ХР 


в сыворотке крови 


8,6—9,3 9,0 2 2 
9,4—10,1 9,8 6 8 
10,2—10,9 10,6 15 23 
110—117 11,4 93 46 
11,8—12,5 12,2 25 Т1 
12,6—13,3 13,0 17 
13,4—14,1 13,8 7 
14,2 —14,9 14,6 5 
Сумма — 100 — 


В данном случае п/2==100/2==50. Эта величина больше 
Ун==46, но меньше Ў; =71. По Ў; =71 определяем интервал, 
в котором находится медиана. Границы этого интервала: ниж- 
НЯЯ Хн==11,8 и верхняя х»==12,5; его частота ѓмг==25. Классо- 


61 


вый интервал ^==0,8. Подставляя эти величины в формулу (28, 
находим 
50 — 
Ме=11,84-0, (25. 


25 
Теперь превратим интервальный вариационный ряд Е 
безынтегральный и вычислим медиану по срединным значень 


ям классовых интервалов. Медиана находится между значения 
ми классов 11,4 и 12,2, Отсюда 


ме 1041222. ЕС 12.2 0,8 (2 зс в )=11,8--0,128 = 11,98. 


)=11,8--0,128 = 11,33. 


Пример 21. ОЕ медиану для ряда распределения кс 
личества поросят в пометах 64 свиноматок (табл. 18). 


Таблица 1: 


Количество поросят Накопленные частоты 


в помете х7 | Число случаев $; | Х|, 
5 4 4 
6 7 11 
7 13 24 
8 15 39 
9 7 
10 9 
11 6 
12 3 
Сумма 64 — 


Здесь п/2=64/2=32. Эта величина превосходит 2; == 24 
но меньше ХУ; = 39. Следовательно, медиана находится межд‘ 
7-м и 8-м значениями классов и хн==(7--8)/2==7,5. Частотг 


медианного класса јмг==15. Отсюда Ме = 7,54 


--0,53= 8,03. Медиана этого распределения очень близка : 
средней арифметической х==8,25 поросят. 

Мода (Мо). Модой называется величина, наиболее част‘ 
встречающаяся в данной совокупности. Класс с наибольшей 
частотой называется модальным. Он определяется довольн‹ 
просто в безынтервальных рядах. Например, мода распределе 
ния численности поросят в пометах 64 свиноматок равна & 
Для определения моды интервальных рядов служит формул: 


Мо = Я (252), 29 
о т | 


Где Хн — нижняя граница модального класса, т. е. класса : 
наибольшей частотой ѓг; р — частота класса, предшествующег‹ 
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‘модальному; [з —частота класса, следующего за модальным; 
`А— ширина классового интервала. 

Пример 22. Определить моду ряда распределения кальция 
(мг%) в сыворотке крови обезьян. Необходимые данные содер- 
жатся в табл. 17. Частота модального класса №» == 25, его ниж- 
няя граница х„==11,8. Частота класса, предшествующего мо- 
дальному, },=23, частота класса, следующего за модальным, 
=17; %=0,8. Подставляя эти данные в формулу (29), нахо- 
дим 


25 —23 
Мо п-ов )=1.8+0,16 11,%. 

Квантили. Наряду с медианой и модой к структурным ха- 
рактеристикам вариационного ряда относятся так называемые 
квантили, отсекающие в пределах ряда определеиную часть его 
членов. К ним относятся квартили, децили и перцентили (про- 
центили). Квартили — это три значения признака (1, 92, Оз), 
‘делящие ранжированный вариационный ряд на четыре равные 
части. Аналогично, девять децилей делят ряд на 10 равных час- 
тей, а 99 перцентилей — на 100 равных частей. 

В практике используют обычно перцентили Рз, Рио, Ргѕ, Ро, 
Рз, Рәо и Рәт. Причем Р.зь и Ру; соответствуют первому и 
третьему квартилям, между которыми находится 50% всех 
‘членов ряда, а Ро соответствует второму квартилю и равен 
‚медиане, т. е. Рзо== Ме. Любой перцентиль определяется рядом 
‘Шоследовательных действий, которые можно выразить в виде 
‘следующей формулы: 


Ру=х,4 х (22 | (30) 


Тде хк — нижняя граница класса, содержащего перцентиль Ру; 
Фна определяется по величине К=1,тј 100, превосходящей или 
роси УН в ряду накопленных частот. Здесь Р; — выбранный 
ерцентиль; п — общее число наблюдений; А — ширина классо- 
вого интервала; [р — частота класса, содержащего искомый 
перцентиль; І, — так называемый порядок перцентиля, показы- 
Вающий, какой процент наблюдений имеет меньшую величину, 
ҹем Ру. Например, для Р»5 и Р;ѕ порядки окажутся соответст- 
Венно равными 25 и 75%. Таким образом, как и при определе- 
Жии медианы, нахождение того или иного перцентиля связано 
© кумуляцией частот вариационного ряда в направлении от низ- 
шего (начального) класса к высшему. 
'’ Пример 23. Найти 50-й перцентиль ряда распределения го- 
дового удоя коров (п==80), для которого определены средняя 
Тае и показатели вариации (см. пример 18, табл, 
13). 
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знам ремонт 


Удой, кг о Ро 


Частоты (ў!) 2 5 13 20 16 17 
а. я 2 7 20 40 56 73 77 80 
Величина К = 2 ==40, она соответствует Уј; = 40. Ниж. 


няя граница класса хь, содержащего Ро, равна 2800; частота 
этого класса {р равна 20; А=100. Подставляем эти величины 


в формулу (30): ?,=2800-{ 100 = -2900. Найденная ве- 


личина оказалась очень близкой к средней арифметической го- 
дового удоя коров этой группы х==2906,25 кг. 
Формула (30) применима и для нахождения перцентилей 
безынтервальных вариационных рядов. 
Пример 24. Найдите 50-й перцентиль для ряда распределе- 
ния численности поросят в пометах 64 свиноматок: 
х э ет в 910 и 12 


Н 4 7 13 15 7 .9 6 3 
рУй 4 9! 24 39 46 55 6 64 


В данном случае К=50-64/100=32. Эта величина больше 
УХр==24, но меньше ХУ}; ==39. Следовательно, хи находится меж: 
ду 7-м и 8-м значениями классов, т. е. Ха = (7--8)/2==7,5; [р= 


=15. Отсюда Ри=7,5-- 8 =“ 8,03. 


11.5. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ 
ПРИ АЛЬТЕРНАТИВНОЙ ГРУППИРОВКЕ ВАРИАНТ 


В данной главе уже упоминалось об альтернативной груп- 
пировке исходных данных, когда одна группа вариант проти: 
вопоставляется другой. Так, число мужских особей в популя- 
ции может противопоставляться числу женских особей, группа 
здоровых индивидов — группе больных индивидов и т. д. При 
альтернативной группировке данных их статистическими ха: 
рактеристиками будут как абсолютные, так и относительные 
численности противопоставляемых друг другу групп (альтер: 
натив). Если абсолютную численность вариант, обладающих 
данным признаком, обозначить через т, то численность вариаит 
противоположной группы, не имеющих данного признака, будет 
равна п—т, где п — общее число членов рассматриваемой с0- 
вокупности. Например, среди п==408 новорожденных оказалось 
т==208 мальчиков. Тогда число новорожденных девочек л-— 
—т=408—208=200. 

Численность альтернатив можно выразить в долях едини 
цы, а также в процентах от их общего числа п. Обозначив д0" 
лю вариант, обладающих учитываемым признаком, через №, 
получим р==т/п. Тогда доля вариант, не обладающих этим 
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признаком, обозначаемая буквой 4, выразится отношением д= 
== (пт) /п==1-— (т/п) =1—р. Для того чтобы численность 
противопоставляемых групп была выражена в процентах, до- 
статочно каждую долю умножить на 100: 


р=(т/п) 100; (31) 
=" 100% =100 — р. (32) 


Очевидно, р--9=1 и р4-9= 100%. 

Относительные частоты или доли вариант при альтерна- 
тивной группировке выполняют такую же роль, как средние 
величины для рядовой изменчивости признаков, когда нсход- 
ные данные распределяются в вариационный ряд. 

В качестве характеристики альтернативного варьирования 
служит среднее квадратическое отклонение ѕр, которое опреде- 
деляют по формуле 


„=У?РИ=Р=Ум. (33) 


Этот показатель одинаково характеризует варьирование обеих 
альтернативных групп. Если же численность групп (альтерна- 
тив) выражена в процентах от их общего числа п, формула 
(33) принимает следующее выражение: 


5р=У р(100 — р). (34) 

Когда альтернативы выражены абсолютными числами, среднее 
квадратическое отклонение определяют по формуле 

5р=У прд. (35) 


Пример 25. Из общего числа н=408 новорожденных доля 
мальчиков составила р==208/408==0,51, а доля новорожден- 
ных девочек д==200/408==0,49. Среднее квадратическое откло- 
нение долей выразится величиной: 5„= 0,51.0,49= 0,2499= 
==0,5. Если выразить в процентах соотношение между количе- 
ством новорожденных мальчиков (51%) и девочек (49%), этот 
показатель будет равен 


5„=7 51(100—51)=У51.49=7/2499=50,0%. 


Для абсолютных значений альтернатив средиее квадратическое 
отклонение выразится величиной 


‚= 408-0,51-0,49—=У/ 101,96 = 10,1. 


3—1674 


ГЛАВА 11 
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ 


11.1. ХАРАКТЕРНЫЕ ЧЕРТЫ ВАРЬИРОВАНИЯ 


В любом более или менее симметричном вариациоином ря 
ду заметна одна характерная особенность — накапливание вг 
риант в центральных классах и постепенное убывание их чи: 
ленности по мере удаления от центра ряда. Эта особенност 
варьирования количественных признаков встречается доволь 


А 3 

ги : 

5 \ 

Зв \ К 

& З 

95 Е 

& ж 

= ^ 

25 

= $ 
$ Я | 7 75 
Длина тела, дюймы Роло а 

Рис. 5. Гистограмма измеичиво- Рис. 6. Гистограмма распреде 
сти длины тела у 117 мужчии ления размеров мужской обуве 


(по Н. Бейли, 1959) среди иаселеиия центральиы: 
областей РСФСР 


часто. Так, например, среди взрослого населения чаще встре 
чаются люди среднего роста, а индивиды очень высокого илЁ 
очень низкого роста — значительно реже. Однако в массе од 
новозрастных индивидов людей выше и ниже среднего рост 
оказывается примерно одинаковое количество. 

Пусть большая масса людей одного пола и возраста раз 
делена на отдельные группы так, чтобы в каждую группу вош 
ли индивиды приблизительно одинакового роста. Пусть затем 
от каждой группы выделено по одному представителю, которыє 
построены в одну шеренгу по ранжиру — от самого низкорос 
лого до самого высокорослого. Если в затылок им поставит: 
членов группы, получается «живая диаграмма» распределени». 
более или менее симметричная. На рис. 5 проиллюстрирован: 
эта закономерность. Отмеченная черта варьирования обнару 
живается не только в распределении людей по росту, но и п‹ 
миогим другим признакам, в частности по размерам обувЕ 
(рис. 6). 

Впервые на эту закономерность варьирования обратил вну- 
мание А. Кетле (1835), исследовавший распределение несколг 
ких тысяч американских солдат по росту (длине тела). «Челе 
веческий рост, — писал он,— изменяющийся, по-видимому, сё 
мым случайным образом, тем не менее подчиняется самым точ 
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ным законам; и эта особенность свойственна не только росту; 
она проявляется также и в весе, силе, быстроте передвижений 
человека, во всех его физических... и нравственных способно- 
стях. Этот великий принцип... разнообразящий проявление чело- 
веческих способностей... кажется нам одним из самых удиви- 
тельных законов мира» !. 

Описанная закономерность относится не только к человеку. 
Выше рассмотрены варьирование глазков в клубнях картофе- 
ля, распределение численности поросят в пометах свиноматок, 
кальция в сыворотке крови обезьян и удоев коров за лакта- 
цию. Подобных примеров можно привести много. Особенно при- 
мечательно, что не только распределение живых существ и про- 
дуктов их жизнедеятельности, но и случайные ошибки измере- 
ний подчиняются этой закономерности. «Не удивительно ли, — 
писал А. Кетле, что случайные ошибки располагаются в та- 
ком совершенном порядке, и наши бессознательные промахи 
проявляются с такой симметрией, которая, кажется, могла бы 
быть результатом тщательно обдуманных расчетов» ?. 

Таким образом, прослеживается широко распространенная 
в природе закономерность: в массе относительно однородных 
единиц, составляющих статистическую совокупность, большин- 
ство членов оказывается среднего или близкого к нему размера, 
и чем дальше они отстоят от среднего уровня варьирующего 
признака, тем реже встречаются в данной совокупности. И это 
независимо от формы распределения, что указывает на опреде- 
ленную связь между числовыми значениями варьирующих приз- 
наков и частотой их встречаемости в данной совокупности. На- 
глядным выражением этой связи и служат вариационный ряд 
и его линейный график — вариационная кривая. Эту законо- 
мерность можно воссоздать априори в виде математической мо- 
дели, не опасаясь впасть в противоречие с фактами. Предвари- 
тельно, однако, полезно напомнить некоторые фундаментальные 
‚понятия теории вероятностей. 


11.2. СЛУЧАЙНЫЕ СОБЫТИЯ 


о  Подброшенный камень падает вниз, брошенный в воду — 
‚тонет. По длине одной из сторон куба можно точно определить 
его объем. На языке теории вероятностей всякий результат, или 
‚исход, однократного испытания называется событием. Под ис- 
пытанием, которое может повторяться бесконечно большое чис- 
ло раз, подразумевают комплекс условий, необходимых для то- 
го, чтобы тот или иной исход мог осуществиться. У каждого из 


| 1 Кетле А. Социальная физика или опыт о развитии способностей чело- 
‚Века. Спб., 1911. Т. 1. С. 38—39. 
2 Там же, С, 330, 
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отмеченных здесь событий есть только один исход, заранее 
предсказуемый. Такие события называются достоверными. Ес- 
ли же при осуществлении комплекса условий события заведо- 
мо произойти не могут, они называются невозможными. 

Существуют события, исход которых заранее непредсказуем. 
Если подбросить монету, то заранее нельзя сказать, как она 
упадет — вверх гербом илн решкой. Здесь исход испытания за- 
висит от случая. События, исход которых при осуществлении 
комплекса условий точно предсказать нельзя, называют слу- 
чайными. 

Случайные события (обозначаются начальными прописными 
буквами латинского алфавита А, В, С,...) называются несовме- 
стимыми или несовместными, если в серии испытаний всякий 
раз возможно осуществление только одного из них. Например, 
при метании монеты она может упасть вверх гербом или реш- 
кой. Здесь два равновозможных и несовместных исхода. Собы- 
тия, которые в данных условиях могут произойти одновремен- 
но, называются совместными. 


11.3. ВЕРОЯТНОСТЬ СОБЫТИЯ И ЕЕ СВОЙСТВА 


Случайное событие можно предсказать лишь с некоторой 
уверенностью или вероятностью, которую данное событие име- 
ет. При этом вероятность рассматривают как числовую меру 
объективной возможности осуществления события А при еди- 
ничном испытании и обозначают символом Р(А). Согласно 
классическому определению, вероятность события А выража- 
ется отношением числа благоприятствующих осуществлению 
этого события исходов т к числу всех равновозможных и не- 
совместных исходов п, т. е. 


Р(А)=т/и. (36) 


Например, в урне находится 5 белых и 10 черных шаров. На- 
угад вынимают один шар. Какова вероятность, что вынутый 
шар окажется белым? Так как из общего числа 15 шаров в 
урне 5 белых, то из п==15 возможных исходов лишь т==5 
«благоприятствуют» осуществлению ожидаемого события, т. е. 
появлению в однократном испытании белого шара. Отсюда ве- 
роятность этого события Р=5/15==1/З^= 0,33, т. е. чем боль- 
ше шансов, благоприятствующих наступлению ожидаемого со- 
бытия, тем выше его вероятность. 

Из «классического» определения вероятности следует, что 
она представляет число, заключенное между нулем и единицей 
(0<Р(4) —<1), т. е. выражается в долях единицы (может быть 
выражена в процентах от общего числа испытаний). Очевидно, 
вероятность достоверного события А равна единице, а вероят- 
ность невозможного события А равна нулю. Из этих аксиома- 
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тических свойств вероятности следует, что вероятность собы- 
тия А и вероятность противоположного события А (не А) в 
сумме равны единице, т. е. Р(А)--Р (А) =1. 
Считают, что события, имеющие очень малую вероятность, 
в единичных испытаниях ие произойдут, т. е. такие события 
рассматривают как практически невозможные. Если же веро- 
ятность события достаточно велика, его принято считать прак- 
тически достоверным. Этот принцип практической уверенности 
‚в прогнозировании исходов случайных событий позволяет ис- 
пользовать теорию вероятностей в практических целях. 
Для упрощения символики принято значение вероятности 
ожидаемого события обозначать строчной латинской буквой р, 
т. е. тем же знаком, которым обозначается частость, а значе- 
ние вероятности противоположного события — буквой 4, т. е. 
Р(А)=ри Р(А) =9, откуда р4-9=1. 
Вероятность, которую можно указать до опыта, называют 
априорной. Например, при подбрасывании монеты заранее из- 
вестно, что она может упасть вверх гербом или решкой. Здесь 
только два возможных исхода, вероятность которых одна и та 
же: р==1/2==0,5. Иное дело, например, испытание действия на 
организм различных доз лекарственных или токсических ве- 
ществ. В таких случаях результаты отдельных испытаний за- 
ранее, до опыта, указать невозможно; вероятность осуществле- 
ния таких событий может быть установлена только на основа- 
нии опыта, т. е. апостериорно. 
Встречаются, однако, и такие события (и их немало), ис- 
‚ход которых, как правило, отклоняется Эт их вероятности. Яр- 
‚ким примером такого рода событий служит соотношение полов 
“в потомстве многих животных и человека. Известно, что пол 
потомства определяется в момент оплодотворения, когда в зи- 
тоту привносятся либо ХХ-, либо ХУ-хромосомы.. Вероятность 
‘появления в потомстве мужских и женских особей одна и та 
же: р==1/2. Это означает, что на 1000 новорожденных детей 
јследует ожидать примерно равное число мальчиков и девочек. 
В действительности же равновеликого соотношения полов в 

отомстве не наблюдается. Так, по данным шведской статисти- 
зки за 1935 г., на каждую тысячу новорожденных число родив- 
иихся девочек составляло на протяжении года от 473 до 491 

‘три средней частоте, равной 482; относительная частота, или 

‘мастость, новорожденных девочек 482/1000=0,482, а частость 
‘рождения мальчиков (1000—482) /1000 = 0,518. Можно также 
‘привести данные австрийской статистики о новорожденных де- 
ях за период с 1866 по 1905 г., т. е. за 40 лет. Доля новорож- 
щениых мальчиков за этот период колебалась от 0,512 до 0,518 


Е 


[ик в среднем 0,515. 


Из этих примеров видно, что при достаточно большом числе 
пытаний частости новорожденных девочек и мальчиков от- 
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клоняются, хоть и иезиачительно, от вероятиости этих событиг, 
равной 0,500. В таких случаях о вероятности событий прииятс 
судить по предельным значениям частости, обладающей усток 
чивостью. Отсюда в отличие от «классической» вероятност: 
частости случайных событий, а точнее — их предельные значе 
ния, обладающие определенной устойчивостью, прииято назь 
вать статистической вероятностью этих событий. Так что числс 
0,482 или округленно 0,48, возле которого колеблются значе 
ния частости рождения девочек, можно принять за вероятност; 
этого события. В то же время статистическая вероятность пояь 
ления в потомстве мальчиков будет равной 0,52. 


11.4. ЗАКОН БОЛЬШИХ ЧИСЕЛ 


Многочисленные опыты и наблюдения показали, что частс 
сти ожидаемых случайных событий приближаются к их верс- 
ятности по мере увеличения числа испытаний п. Так, если одн" 
и ту же моиету подбрасывать большое число раз, то иевозмож 
но ожидать, чтобы во всех без исключения случаях выпадат. 
только герб или только решка. Ясно, что в каком-то числе слу 
чаев выпадет герб, а в других случаях — решка. Примечатель 
ио, что чем больше число испытаиий, тем ближе к единице 
оказывается отношение выпавших гербов и решек, а частост: 
каждого события становится ближе к его вероятности. Под 
тверждением тому служат результаты опытов с метанием мс. 
нет, проведенные разными лицами (табл. 19). 


Таблица 1‹ 


Число Отклонение 
Число случаев Частость частости 
Кем проведен опыт испытаний выпадения события от вероят- 
монеты ности 
гербом событня 
Бюффоном 4 040 2048 0,5069 0,0069 
Пирсоном: 0,0016 
первый опыт 12000 6019 0,5016 
второй опыт 24 000 12012 0,5005 0,0005 


Из табл. 19 следует, что с увеличеиием числа испытаииѓ 
отклонение частости ожидаемого результата от его вероятно 
сти (р==0,5) уменьшается. В этом факте проявляется действие 
закона больших чисел, теоретическое обоснование котором‘ 
было дано Я. Бернулли (1713), а также П. Л. Чебышевым г 
другими математиками ХІХ столетия. Этот закон утверждает 
что частость т/п события А будет сколь угодно близкой к ег‹ 
вероятности р, если число испытаний неограниченно возраста 
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ет. Как было показано выше, частость события и его вероят- 
ность не совпадают. Разница между ними уменьшается при 
увеличении числа испытаний. Можно взять сколь угодно малое 
число е и сравнивать его с разиицей между частостью и веро- 
ятностью события. Вероятность того, что эта разница превы- 
сит число г, будет стремиться к нулю при стремлении числа 
испытаний п к бесконечности, т. е. 


Раи 0: 


Этот вывод подтверждается и опытом Кетле: в урну поме- 
щали 20 белых и 20 черных шаров, затем извлекали из нее 
наугад один шар, регистрировали его и возвращали обратно. 
Каждое испытание повторяли многократно. Вероятность появ- 
ления белого или черного шара оставалась при этом постоян- 
ной, равной 1/2. Результаты опыта Кетле приведены в табл. 20. 


Таблица 20 


Из нях оказалось 


ЕЕ рее Е Соотношение 
выиутых 
Число У белых и чериых 


белых чериых шаров 


шаров 


Из табл. 20 видно, что с увеличением числа испытаний со- 
отношение белых и черных шаров приближается к единице. 

Закон больших чисел, как и другие статистические законы, 
іо которых речь пойдет ниже, имеет объективный характер: их 
і действие не зависит от сознания и воли людей. В качестве при- 
| мера, иллюстрирующего действие закона больших чисел, можно 
| рассмотреть русскую почтовую статистику за период с 1906 по 
| 1910 г., приведенную в табл. 21 (по А. А. Кауфману, 1916). 
| Письмо без адреса или без указания места назначения, 
опущенное в почтовый ящик, — явление случайное. А между 
„тем, как явствует из данных табл. 21, число таких случаев из 
‚года в год оставалось относительно постоянным. Такие факты 
‚были известны еще П. Лапласу. Затем А. Кетле и другие ста- 
‹тистики собрали большой материал, убедительно свидетельст- 
‹вующий о наличии внутренней связи между случайностью и за- 
‚ Кономерностью, существующей в сфере массовых явлений. 
:К. Маркс по этому поводу писал: «...виутренний закон, прокла- 
-дЫывающий себе дорогу в этих случайностях и регулирующий 
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их, становится видимым лишь тогда, когда они охватываются, 
в больших массах...» 1. 


Таблица 2 
Из них оказалось На 1 млн. приходнтся 
Всего писем 
Год Е без указания 
пнсем, млн. без адреса места без указания 
назначения без адреса места 
назначения 
1906 983 26 112 28 749 27 29 
1907 1076 26 977 26 523 25 25 
1908 1214 33 515 26 112 27 21 
1909 1357 33 643 28 445 25 21 
1910 1507 40 101 36 513 27 24 


11.5. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


Представим, что в отношении некоторого случайного собы- 
тия А производят п независимых испытаний при условии, чт‹ 
в каждом испытании вероятность р появления этого события 
постоянна. Будем учитывать только два исхода: появление сс- 
бытия А либо противоположного ему события А, тоже имек 
щего постоянную вероятность 4, причем р-+-9==1. При этих ус- 
ловиях, если событие А в п испытаниях появится т раз, собь. 
тие А будет встречаться и—т раз. Вероятность любого исхода: 
(Р„(т)) независимо от того, в каком порядке эти события че 
редуются, выразится произведением р”д”"” (по правилу ум 
иожения вероятностей), умноженным на биномиальный коза’. 


п! 


фициент Св= , ТВ. 


ті (п — т)! 
Р, (т) =Сп р"9"-". (37 


Эта формула (формула Бернулли) позволяет находить ве 
роятность того, что из п взятых наугад элементов окажется т 
ожидаемых. 

Пример 1. Какова вероятность появления 0, 1, 2, 3, 4, 5 осс 
бей мужского пола в числе пяти новорожденных? Можно пе 
казать, что возможна серия из пяти (п==5) повторных наблк. 
дений с двумя исходами. При этом появление особей мужског‹ 
пола (событие А) может иметь в серии различное числовое 
выражение т от 0 до 5, как и противоположное событие А (по 
явление особей женского пола). В каждом испытании вероят 


1 Маркс К., Энгельс Ф. Соч. 2-е изд. Т. 25. Ч. П. С. 396. 
2 Читается: вероятность появления события А в п нспытаниях т ра, 
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ность появления события А(р) или А(49) будет одинаковой и 
равной 0,5. Вероятность того, что в «пятерке» не будет ни од- 


т Ж 


Х (0,5) 5=1.1.0,03125=0,03125. Вероятность того, что в «пя- 
Кет окажется одна особь мужского пола, составит Р»(1) = 


= = тг, 5) 0,0625 —0,15695. 


Аналогично определяем: Р»(2) = 10(0,25) (0,125) == 0,3125; 
Рь (3) =0,3125; Р. (4) =0,15625; Р (5) ==0,03125. Легко убедить- 
в 
ся, что У Р,(т)=1. Точно так же можно вычислить вероят- 
т=0 
ность осуществления т любых событий в и независимых испы- 
таниях при условии постоянства вероятности появления собы- 
тия (Р,(А)). Совокупность этих вероятностей — Р„(0), Р„(1), ... 
.,Р„(т) — называется биномиальным распределением. 
Можно показать, что 


ной особи мужского пола, составит Рь(0)== 


1 
У Р,(т)=(р+9)". (З7а) 


тч) 
Так, при п==9 возможны следующие исходы: 


Результаты испытаний АА АА АА АА 
Вероятность исходов р? рӯ ар 9? 


или (р-9)?=р?-+-2ра-9?=1. При трех независимых испыта- 
ниях возможно 23==8 исходов, вероятности которых распреде- 
лятся следующим образом: (р-+9)3==р3з-3р?49-3Зра?- 43 и т. д. 
Следовательно, закон биномиального распределения выража- 
ется не только формулой Бернулли, но и формулой бинома 
Ньютона: 


—1 
(рт р"-пр"— Б рер..." (38) 


Так, например, при п==10 возможны 2!0= 1024 исхода, кото- 
рые распределятся следующим образом: Ро (т) = (0,54-0,5)! == 
== 1/1024--10/1024--45/1024--120/1024--210/1024--252/1024 +- 
--210/1024--120/1024 + 45/1024 - 10/1024 + 1/1024 = 1. Если 
этот ряд представить в виде графика, как показано на рис. 7, 
получается полигон биномиального распределения, где ордина- 
ты соответствуют членам разложения бинома (1/2--1/2)19. Из 
рис. 7 видно, что биномиальная кривая строго симметрична от- 
носительно максимальной ординаты, являющейся центром би- 
номиального распределения. 
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Из приведенного примера также следует, что распределение 


в 
вероятностей У Р,(т) =(р-|-4)% соответствует коэффициен 


т 0 


там разложения бинома Ньютона, отнесенным к одному и то- 


(и). 


200. 
1024 


10 
1024 


Рис. 7. Распределение вероятно- 


ї а? 
12354557891 


му же знаменателю, равному 2’ 
Биномиальные коэффициенте 
легко вычислить при помощ 
арифметического треугольнике 
Паскаля, в котором каждая циф 
ра находится суммирование» 
двух цифр, стоящих над не 
(табл. 22). 

Сумма биномиальных коэф 
фициентов для любой степене 
бинома, как это видно из табл. 
22, равиа 2”. 


п 


1 | \10 
стей двучлена (+5) Характер биномиального рас 


пределения не изменится от спо- 
соба выражения исходов испыта- 


ний — в значениях вероятности или в абсолютных значения: 
частоты ожидаемого результата. В том и другом случае бине- 
миальный закон выражет зависимость между частотой ожида= 
мого результата и числом независимых испытаний, проведек- 


о ә әде Әу әтәс мо һо 


= 
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Таблица 2: 


Биномиальные коэррициенты 


10 

БЛ н 

пез 1 7 

вя пя 8 в І 

5 8 2 50 8 59 

05 10 20 20 20 1210 Ы Т 
и тд. 


6 


6 


7 1 


9 


ных в отношении случайного события А. Причем частота т 
появления ожидаемого события А в п независимых испытаний 
определяется его вероятностью р, которая остается постоянной 
в каждом отдельном испытании. 

Закон биномиального распределения неоднократно подвер- 
гали экспериментальной проверке. Так, еще в 1912 г, В. И. Ро- 
мановский 20160 раз подбро- 
сил четыре одинаковые моне- 
ты, учитывая в каждом испы- АСАТИАНИ 
тании комбинации «герб — 
решка». Результаты испыта- 
ний оказались следующие 
(табл. 23). 

Из табл. 23 видно, что час- 
тоты встречаемости возмож- 
ных комбинаций «герб — реш- 
ка» распределились строго за- 
кономерно; их частости почти 
полностью совпали с вероят- 
НОСТЬЮ ИСХОДОВ ДЛЯ ЭТИХ КОМ- 
бинаций. 

Аналогичные результаты 
были получены и другими ис- 
следователями, проверявшими 
действие биномиального зако- 
на на самых различных моде- 
лях. Ф. Гальтон сконструиро- 
вал специальный прибор, ил- 
люстрирующий закономер- 
ность биномиального распре- 
деления. Этот прибор пред- 
ставляет собой небольшую до- 
щечку с окаймленными края- 
ми, посреди которой на рав- Рис. 8. Прнбор Гальтона 
ном расстоянии в шахматном 
порядке вбиты мелкие гвозди (рис. 8). В нижней части доски 
помещены равные по размерам и открытые сверху отсеки, в 
верхней — расположено отделение с узкой щелью, направлен- 
ной вниз, к середине доски. Через эту щель, находящуюся над 
гвоздями, насыпают дробь. При этом доску ставят наклонно 
под углом около 35° к поверхности стола, так что дробинки 
устремляются вниз, к отсекам. Ударяясь о гвозди, они отска- 
кивают в различные стороны от линии, ведущей к центрально- 
му отсеку. Этот случайный процесс приводит к тому, что дро- 
бинки закономерно распределяются по отсекам, образуя стол- 
биковую диаграмму, напоминающую гистограмму распределе- 
ния частот по классам вариационного ряда. 


н 


н 
27 
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Выпало одновременно 


Абсолютные Частости, % Вероят. 
частоты {округленные исходоь 
гербов решек комбинации данные) 

4 0 1181 6 6,2: 

3 1 4909 24 25,04 

2 2 7 583 38 37,5 

| 3 5 085 25 25,01 

0 4 1402 7 6,2Е 
Сумма 20 160 100 100,05 


Для расчета теоретнческих (выравнивающих) частот 
рнационного ряда | в формулу (37а) вводят множите... 
равный сумме всех частот эмпирического вариационного г.. 


Я Л’=М (Р-9", 
где М=У{; р — вероятность ожидаемого события; д=.— к 
п— число членов ряда без единицы, т. е. п=т—-1. 
Пример 2. Существует следующее распределенне числен 
стн самок в 113 пометах лабораторных мышей: 


Число самок в по- 

мете т...... 0 | 2 3 4 5 6 7 : 
Число пометов с та- 

ким количеством са- 

мк... ..... 0 1 10 17 46 28 8 3 ( 


В данном случае ожидаемое и противоположное события 
нмеют одну н ту же вероятность р==д==0,5. Чнсло классоғ 
(без нулевых) равно семн. Сумма частот ряда М==113, а п= 
==7—1==6. По треугольнику Паскаля (см. табл. 22) подбира 
ем ряд биномиальных коэффициентов (К), численно равны? 
16 15 20 156 1 для случая т==7; сумма членов ряда К равн: 
64. Подставляем известные величины в формулу (39): 
абв, в, 6 
>/ =13 (5 т 1) аа ае Ра + 
+) 177+ 10,59-- 26,48 -{-35,32- 26,48 -|- 10,59-+ 1,77 = 


= 113,00. Округляя числа, получаем теоретически ожидаемые ча- 
стоты ряда: 


т 1 2 З 4 5 6 7 
Ё 2 П 26 35 26 И 2 


На моделях с известной вероятностью (р==9==1/2) ожи- 
даемые частоты биномнального ряда легко рассчитываются п 
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:ледующей формуле: 
=. (40) 
“ак, ожидаемые частоты ряда распределения самок в 113 по- 


тетах лабораторных мышей рассчитывают по формуле (40) 
‘ледующим образом (табл. 24): 


Таблица 24 
МК 
Бииомиальные Рама Округленные 
Классы т Частоты [4 коэффициеиты К = К значения } 


На моделях с неизвестной вероятностью значение р в фор- 
луле (39) приходится определять по средней величине полу- 
енных в опыте данных, т. е. исходить из статистической веро- 
‘тности данного события. В таких случаях расчет теоретиче- 
‘ких (выравнивающих) частот биномиального ряда производят 
: помощью следующей формулы: 


У = М (рд"-"К), (1) 


де М и К имеют те же значения, что и в предыдущих форму- 
‚ах, а р — статистическая вероятность события, определяемая 
тношением т/п, т. е. по средней взвешенной == Ўт; /№ и == 
=1—р. 

Пример 3. В табл. 23 приведены результаты опыта Рома- 
овского по проверке биномиального закона Бернулли. Выяс- 
лить, согласуются ли полученные в опыте данные с моделью 
иномиального распределения. Начнем с определения взвешен- 
10й средней (т) ряда: 


т 0 1 2 3 4 
Н 6 24 38 25 7 УР: = № 100 
тн 0 24 76 75 28 Утр=203 


Отсюда т=203/100==2,03 и п=4. Тогда р=т/п==2,03/4= 
=0,5075 22 0,508; 9==1—р==0,492. Получается следующая эм- 
лирическая формула: У! ==100(0,508-1-0,492) 4. 

Для того чтобы рассчитать по этой формуле теоретически 
ожидаемые частоты ряда, необходимо, как и в предыдущем 
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случае, подобрать биномиальные коэффициенты, на которые 
будут умножены значения р и 4. В данном случае ряд распре 
деления состоит из пяти членов, ему соответствуют следующие 
биномиальные коэффициенты: | 4 6 4 1. 

Строим вспомогательную таблицу, первая графа которо: 
заполняется «классами» вариационного ряда т. Во второй гра 
фе начиная со второго класса (сверху) помещен р==0,508, = 
4=0,492 вносим в третью графу таблицы, отступив на оди+ 
шаг от последнего класса (табл. 25). 


Таблица 27 


Р 


Округлен- 


ртап--тК = 100(ртус ные 
Х9"-тК)| значения 


Затем последовательно находим р», рз, рї и т. д., а также 4? 
9°, 9* и так до конца ряда. Именно: р?= (0,508)2=0,258; р = 
= (0,508)3 =0,131 ит. д. Таким же образом рассчитаны значения 
9. Дальнейшие действия понятны из табл. 25. Указанием на тс 
что р ид рассчитаны правильно, служит равенство У (р"д”-"К) == 
= 1, Умножая величины (р”д”-"К) на общее число наблюдениї 
(№), которое в данном случае равно 100, получаем теоретически: 
(выравнивающие) частоты | ряда. 

Если решать эту задачу на модели с известной вероятностьк. 
приняв для каждого исхода комбинаций «герб—решка» р=д= 
= 0,5, то получается следующий результат: 


2 4 и а 8, в КИ == 

21005-92 100 (15 + 16 С 16 55 16 т т 
—6,25 { 25,00-- 37,50-{ 25,00--6,25 = 100. 

Результат вычисления близок к тому, который был получен н: 


модели с неизвестной вероятностью, хотя полного совпадения 
между этими данными нет. 


11.6. РАСПРЕДЕЛЕНИЕ ПУАССОНА 


Характер биномиальной кривой определяется двумя величина 
ми: числом нспытаний л и вероятностью р ожидаемого результг 


78 


та. При р==9 биномиальная крнвая строго симметрична и по ме- 
ре увеличения числа испытаиий прнобретает все более плавный 
ход, приближаясь к своему пределу — нормальной кривой (см. 
ниже). Если р==9, бииомиальиая кривая становится асимметрич- 
ной и тем сильнее, чем больше разиица между ри 0. Когда веро- 
ятность события очень мала и исчисляется сотыми и тысячными 
долями единицы, распределение частот таких редких событий в 
п независимых испытаний становится крайне асимметричным. 
Для описания такого рода распределений редких событий служит 
формула Пуассона 


а" 


ев = 


Р,(т)= = | (42) 


т! ей 
где ағ: пр — наивероятнейшая частота ожидаемого события; 
т — частота ожидаемого события в п независимых испытаний; 
е= 2,7183 — основание натуральных логарифмов; т — факториал 
или произведение натуральных чнсел 1.2:3:4...т. 

Формула Пуассона позволяет определять вероятность для лю: 
бых значений а от 0 до п. Например, для а==2 вероятность того, 
что событие А в данных условиях не осуществится, будет равиа 


— бе? (2.7183) 7,389 — 


Вероятность единичного осуществления ожидаемого события 
при этих условиях выразится следующей величиной: 


2 2 2 
== ——_————— === 2 А 
15 ие (0,7183): 7,389 ых 
23 8 
Для трех случаев Р, Е Е 0,1805 и т. д. 


(см. табл. ПІ Приложений). 

Чтобы формула Пуассона выражала не вероятности, а ожи- 
даемые абсолютные частоты [ редкого события, ей придают 
следующий вид: 

= 
= е5, (43) 
ті 

Здесь |’ — теоретические ордииаты кривой распределения 
Пуассона, или ожидаемое число случаев редкого события в каж- 
дом отдельно взятом классе испытания — 0, 1, 2, 3, 4 ит. д.; п— 
число испытаний; х — среднее число фактически наблюдаемых 
случаев (взятое вместо а); объяснения остальных символов те 
же, что в формуле (42). 

Распределение Пуассона — частный случай биномиального 
распределения. Оно, как и биномиальное распределение, прнбли- 
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2,(т) жается к нормальной кривой 
(см. ниже) при возрастании 
числа апр (рис. 9). 

По закону Пуассона рас- 
пределяются редкие случайные 
события, встречающиеся в ми- 
кробиологии, радиобиологии и 
других разделах современной 

=5,0 биологии. Например, установ- 

№ лено, что численность перези- 

6 7 8 9 Ют мовавших клопов вредной че- 

Рис. 9. График функции Р„(т)= Репашки на пробных площад- 

ат ках распределяется по закону 

те и значений 2 Пуассона. По этому же зако- 

ну распределяются частоты 

спонтанных мутаций у кишечной палочки. Подобных примеров 
можно привести много. 


Ру... ОРШИН 2 
012945 


11.7. ПАРАМЕТРЫ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЙ 


Биномиальное распределение характеризуется двумя пара- 
метрами: средним, или наивероятнейшим, числом и ожидаемого 
результата и дисперсией частоты вт? события А в п независимых 
испытаний. Первый параметр приближенно равен произведению 
числа испытаний п на вероятность р, которую событие А имеет в 
каждом классе испытаний, т. е. р==пр. Второй параметр равен 
произведению числа испытаний п на вероятность р ожидаемого 
события А и вероятность д противоположного события Д, т. е. 
Ст?== прӯ. Корень квадратный из дисперсии называется стандарт- 
ным отклонением. 

В отличие от биномиального распределения распределение 
редких событий, следующих закону Пуассона, характеризуется 
одним параметром — средней величиной (пр=т-=х), так как для 
этого распределения характерно равенство ољ? =й. Кроме того, 
распределение Пуассона, как и другие асимметричные распреде- 
ления, характеризуется очень высоким коэффициентом вариации. 
Эти особенности распределения редких событий иллюстрирует 
опыт по облучению штамма бактерий а-частицами, результаты 
которого и их обработка приведены в табл. 26. 

Характеристики этого распределения: т=798/517= 1,54 и 
5т? ==790,3/516== 1,53. Отсюда Со==100У 1,53/1,54=80,2%. Сов- 
падение по абсолютной величине дисперсии и средней арифме- 
тической указывает на то, что данное распределение следует 
закону Пуассона. | 

Расчет теоретических частот (}') по закону Пуассона произ- 
водят по формуле (43). Это показано на примере 4. 
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Таблица 26 


Поражае- 


боа АЕА Г тр; тт (т—т) Һот)? 
ных клеток 
т 
0 112 0 —1,54 2,3716 265,6192 
1 168 168 —0,54 0,2916 48,9888 
2 130 260 —0,46 0,2116 27,5080 
3 68 204 41,46 2,1816 144,9488 
4 32 128 +2,46 6,0516 193,6512 
5 5 25 43,46 11,9716 59,8580 
6 1 6 --4,46 19,8916 19,8916 
7 1 7 --5,46 29,8116 29,8116 
Сумма 517 798 — — 790,2772 


Пример 4. Воспользуемся данными опыта по облучению 

амма бактерий а-частицами (см. табл. 26) и рассчитаем для 
..ого распределения теоретические частоты. В данном случае 
1=517; х=1,5; е 15-=0,22311; классы испытаний т: 01234 т | 
1м соответствуют т! = 01=1; 11=1; 2!1=1.2=2; 31=2.3=6; 
15720: 7 = 5040, а также 1 5 = 225; 1,53=3,375; 1,5%= 5,063; . 42,9 
,57 = 17,086. 

Подставляем известные величины в формулу (42): 


’=517.0,2231 =115,34=115 
р’==517.1,5.0,2231 == 173,04 = 173 
517.2,25.0,2231 


а =129,77 =130 
. . 0,2231 
Вт: 
6 
= 517.5,063.0,2231 24 35—24 
24 
. 4.0,2231 
м 517.7,594.0,223 —730-=7 
120 
517.11,391.0,2231 
= 82=2 
№ 720 
.17,086. 0,2231 
== 517.17,086.0 039-1 
5040 
Сумма 516,89 = 517 


1 Значения показательной функцин е-+ см. в справочниках по математике, 
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4 ахле: 1еоретических частот можно упростить, применяя 
табл. ПІ Приложений, в которой содержатся значения вероятно- 
сти Р(т) для каждого класса испытаний т и средней величины 
а=х. Чтобы получить теоретические частоты |’, достаточно зна- 
чения вероятности Р(т), приведенные в табл. Ш Приложений 
для ти (вместо а=пр), умножить на общее число наблюде- 
ний п. Так, для #=1,5 и т=0 в табл. Ш Приложений находим 
Р(т) =0,2231. Умножая эту величину на п, равное 517, получаем 
о’ == 115,34. Затем для т=1 и 2= 1,5 в той же таблице находим 
Р(т) =0,3347 и }’=517-0,3347 = 173,04 и так поступаем до конца 
ряда, как это показано в табл. 27. 


Таблица 27 


Теоретические частоты Ё,’ 


Классы т Частоты Р; Р(т) 
расчетные с `округленнем 

0 112 0,2231 115,34 115 
1 168 0,3347 173,04 173 
2 130 0,2510 129,77 130 
3 68 0,1255 64,88 65 
4 32 0,0471 24,35 24 
5 5 0,0141 7,29 7 
6 1 0,0035 1,81 2 
7 1 0,0008 0,41 1 

Сумма 517 — 516,90 517 


При сравнении (визуальном) эмнирических частот с частота- 
ми, вычисленными по закону Пуассона, видно, что они согласу- 
ются между собой. 


111.8. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


Случайные величины. Как было показано выше, варьирую- 
щие признаки в математике рассматривают как переменные слу- 
чайные величины, способные в одних и тех же условиях испыта- 
ния принимать различные числовые значения, которые заранее 
невозможно предсказать. Случайные величины делят на дискрет- 
ные и непрерывные. Случайная величина называется дискрет- 
ной, если оиа может принимать только определенные фиксиро- 
ванные значения, которые обычно выражаются целыми числами. 
Если же случайная величина способна принимать любые число- 
вые значения, она называется непрерывной. Очевидно, что счет- 
ные признаки относятся к дискретным Флучайным величинам, 
тогда как признаки мерные, варьирующие непрерывно, являются 
величинами непрерывными. 
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Случайная величина Х в серии независимых повторных испы- 
таний может принимать самые различные значения, но в каждом 
отдельном испытании она принимает единственное из возможных 
значений д;. 

Закон распределения случайных величин. Функция [(х), свя- 
зывающая значения х; переменной случайной величины х с их 
вероятностями р;, называется законом распределения этой вели- 
чины. Закон распределения случайной величины можно задать 
таблично, выразить графически в виде кривой вероятности и опи- 
сать соответствующей формулой. Закон распределения дискрет- 
ной случайной величины может, например, выражаться в виде 
биномиальной кривой и описываться формулой Бернулли, кото- 
рая позволяет находить вероятные значения этой величины в 
серии независимых испытаний. В отношении же непрерывной слу- 
чайной величины речь может идти лишь о тех значениях, которые 
она способна принять с той или иной вероятностью в интервале 
от и до. Этот интервал может быть каким угодно: и большим, и 
малым. Выдающиеся математики — А. Муавр (1733), И. Г. Лам- 
берт (1765), П. Лаплас (1795) и К. Гаусс (1821) — установили, 
что очень часто вероятность Р любого значения х; непрерывно 
распределяющейся случайной величины х находится в интервале 
от х до х+ 4х и выражается формулой 


1 1 (хр)? 


у е 2 с х, А (44) 


где 4х — малая величина, определяющая ширину интервала; ли 
е — математические константы (л — отношение длины окружно- 
сти к ее диаметру, равное 3,1416...; е=2,7183 — основание нату- 
ральных логарифмов); с — стандартное отклонение, характеризу- 
ющее степень рассеяния значений х; случайной величины Х во- 
круг средней п, называемой математическим ожиданием. 
В показатель степени числа е входит нормированное отклонение 
ї= (х:—и)/с — величина, играющая важную роль в исследова- 
нии свойств нормального распределения, описываемого форму- 
лой (44). 

Как видно из этой формулы, закон нормального распределе- 
ния (нормальный закон) выражает функциональную зависимость 
между вероятностью Р(Х) и нормированным отклонением і. Он 
утверждает, что вероятность отклонения любой варианты х; от 
центра распределения в, где х-—и==0, определяется функцией 
нормированного отклонения #. Графически эта функция выра- 
жается в виле кривой вероятности, называемой нормальной 
кривой. Форма и положение этой кривой определяются только 
двумя параметрами: џ и о. При изменении велнчины р форма 
нормальной кривой не меняется, лишь график ее смещается 
вправо или влево. Изменение же величины а влечет за собой 
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Р(Х) 


изменение только ширины кривой: при уменьшении о кривая 
делается более узкой за счет меньшего рассеяния вариант во- 
круг средней, а при увеличении с кривая расширяется. Во всех 
случаях, однако, нормальная кривая остается строго симмет- 
ричной относительно центра распределения, сохраняя правиль- 
ную колоколообразную форму (рис. 10). 


Тя А т х0 + ЕЯ 


Рис. 10. Нормальные кривые (1, 2, Рис. 11. Стандартнзованная форма 
8) прн разных значениях парамет- нормальной крнвой (прн в=1) 
ра с (01<0:< 03) 


Нормальная кривая с параметрами џр=0 и с=1 называется 
нормальной или стандартизованной кривой. Она описывается 
формулой 

1 


1% 
= у е. (45) 


Любую нормальную кривую можно привести к стандартной 
(вычитанием п из х;и делением на в). Стандартная кривая (рис. 
11) имеет площадь, равную единице. Ее вершина, т. е. макси- 
мальная ордината ушах, Соответствует началу прямоугольных 
координат, перенесенному в центр распределения, где х;—и=0. 
Вправо и влево от этого центра случайная величина Х может 
принимать любые значения, и величина каждого отклонения 
(х:—и) определяется функцией его нормированного отклонения 
КИ. Вероятности Р таких отклонений, соответствующие разным 
значениям #, приведены в табл. 1 Приложений. 

Для того чтобы ордината выражала не вероятности, а абсо- 
лютные числовые значения случайной величины, т. е. выравнива- 
ющие частоты вариант эмпирического распределения, нужно в 
правую часть формулы (45) внести дополнительные множители: 
в числитель — общее число наблюдений п, умноженное на вели- 
чину классового иитервала А, а в знаменатель — величину сред- 
него квадратического отклонения эмпирического ряда распреде- 
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ления 5х. В результате можно записать формулу 
= рф). (46) 
5; 


Здесь }' — теоретические (выравнивающие) частоты вариаци- 
онного ряда, а (і) — значения функции нормированного откло- 
нения, рассчитанные по формуле (46). Эти значения содержатся 
в табл. 11 Приложений. Прнменяя табл. І и П Прнложеннй, мож- 
но по двум показателям (средней арифметической Х и среднему 
квадратическому отклонению $») вычислить теоретические часто- 
ты эмпнрнческого вариационного ряда, рассчитать ординаты и 
построить график нормальной крнвой. Сравнивая частоты эмпи- 
рического вариационного ряда с частотами, вычисленными по 
формуле (46), можно проверить, следует лн эмпнрическое рас- 
пределение нормальному закону. 

Пример 5. По выборке, состоящей из 267 взрослых мужчнн, 
для длины тела получен вариационный ряд (табл. 28). 


Таблица 28 
ст Теоретические 
э Я В: частоты 
ите алоа | ские заны| с, 212. | Ординеты, 
х, см і 5х кривой }(!) округ- 
расчетные ленные 
158 3 —2,77 0,0086 1,6 2 
161 9 —2,03 0,0508 10,0 10 
164 31 —1,29 0,1736 34,3 34 
167 71 —0,55 0,3429 67,8 68 
170 82 +0,19 0,3918 77,6 78 
173 46 +-0,93 0,2589 51,2 51 
176 19 41,67 0,0989 19,5 19 
179 5 +2,41 0,0219 4,4 4 
182 1 +3,15 0,0028 0,6 1 
Сумма 267 — — 267,0 267 


Характеристики этого распределения: х= 169,22 см и $, = 
= 4,06 см (эти показатели читатель может вычислить). Из 
табл. 28 видно, что расчет теоретических частот начинается с 
нормнрования членов варнационного ряда, т. е. вычисления &#. 
Затем по табл. 11 Приложений находят значение функции | (і) 
для каждого нормированного отклонення # эмпирического ряда. 
Перемножая значения (і) на величину п^/5х, равную в данном 
случае 267. 3/4,06 == 198, находят теоретические (выравнивающие) 
частоты данного распределения. Из рис. 12 видно, что представ- 
ленные в виде линейного графика эмпирическне и вычисленные 
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по нормальному закону частоты этого распределения согласуют- 
ся между собой. 

Параметры нормального распределения. Как было показано, 
нормальное распределение характеризуется двумя параметрами: 
средней величиной, или математическим ожиданием џ, и диспер- 
сией с,2 случайной величины Х. Первый параметр равен сумме 
произведений отдельных значений х; случайной величины Х на 
их вероятности ру, т. е. 


п 
== рр А34... 4 Хара У, ХР. 
і=1 


Второй параметр равен сумме квадратов отклонений отдельных 
значений х; случайной величины Х от ее математического ожида- 


ния |, т. е. 2 У [х )), или с учетом повторяемости ѓ; 
= [х ВОР Л}. 


Формально математическое ожидание соответствует средней 
величине эмпирического 
распределения, однако, по 
существу, эти показатели 
отождествлять нельзя. 
Среднюю величину опре- 
деляют как сумму всех 
членов ряда, отнесенную 
к их общему числу, а ма- 
тематическое ожидание 
ә» представляет собой сум- 
57 05 т му произведений членов 
Длина тела, си ряда на их вероятности. 
Рне. 12. Эмпнрическая (1) н вычисленная ЭМпирическая средняя 
по нормальному закону (2) кривые рас- стремится к математиче- 
пределення длины тела у 267 мужчин скому ожиданию случай- 
ной величины по мере 
увеличения числа испытаний; при небольшом числе испытаний 
средняя может значительно отклоняться от своего математи- 
ческого ожидания, 

Основные свойства нормального распределения. Для нормаль- 
ного распределения характерно совпадение по абсолютной вели- 
чине средней арифметической, медианы и моды. Равенство меж- 
ду этими показателями указывает на нормальность данного рас- 
пределения. Вероятность отклонения любой варианты в ту или 
другую сторону от средней в на $ 2Ё и Зі, как это видно из 
табл. І Приложений, следующая: 


Р {< |х 01 +-2)==0,6827; 
Р{—22< |х |< +21} = 0,9545; 
Рд 3 |х — < 4-32} 0,9973. 


9 
=] 


з 


хх 
+ 


г 
> 


Количество слуиагв (частота) 


3 
< 
Б 
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Это означает, что при распределении совокупности наблюде- 
ний по нормальному закону из 10000 вариант в интервале от 
и—{ до и--Ё окажется 6827 вариант, или 68,3% от общего числа 
вариант, составляющих данную совокупность. В интервале от 
и— 21 до и-- 2Ё будет находиться 9545 вариант, или 95,4% от чис- 
ла всех вариант совокупности. И в интервале от и— ЗЕ до и- 3 
окажется 9973, или 99,7% от общего объема совокупности. 

Следовательно, с вероятностью Р==0,6827 можно утверждать, 
что наугад отобранная из нормально распределяющейся сово- 
купиости варианта не выйдет за пределы от и— до џ+і, или в 
компактной форме рі. Вероятность того, что случайно отобран- 
ная варианта не отклонится от средней и более чем на и-=З& 
равна Р=0,9973. Это озиачает, что 99,7 от всех вариант нор- 
мально распределяющейся совокупности находится в пределах 
и-Е30. Этот важный вывод известен в биометрии как правило 
плюс—минус трех сигм. 


11.9. РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА 


По нормальному закону распределяются многие биологиче- 
ские признаки, но не все: нередко встречаются и асимметричные 
распределения, которые, однако, не следуют закону Пуассона. 
Одиим из трех распределений является распределение, описыва- 
емое формулой Максвелла 


7 
Р = у и е ? ах. (47) 


В этой формуле а = 0,6267 5 — параметр распределения, опре- 
деляемый через среднюю арифметическую х варьирующего при- 
знака; і=х:/а, где х; — числовые значения случайной величины 
Х; 4х — разность между двумя смежиыми значениями перемен- 
ной величины Х. 

Указанием на то, что эмпирическое распределение следует за- 
кону Максвелла, служит равеиство между средним квадратиче- 
ским отклонением и величиной 0,674 а, т. е. 5,==0,674 а, тогда 
как для распределения Пуассона характерно равенство 5х? ==х, 

Чтобы рассчитать по формуле (47) теоретические (выравни- 
вающие) частоты, нужно проделать следующее. 1. Определить 
среднюю арифметическую эмпирического вариационного ряда и 
параметр а. 2. Разделить каждую классовую варианту х; на ве- 
личииу а, что даст значения і. 3. Найти для каждого значения 
= х:Ја по табл. П Приложений значение функции (і). 4. Опре- 
целить значения Ё/а. 5. Умножить значения Ё/а на удвоенную 
величину і и на величину классового промежутка (^=4х), т. е. 
эпределить Р= (2/а)2}(1)А. 6. Умножить значения Р на общее 
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число наблюдений п, получить теоретические (выравнивающие 
частоты данного вариационного ряда, т. е. ѓ'= Ри. 

Пример 6. При скрещивании мелкоплодной линии томатов : 
крупноплодной линией того же сорта в первом поколении плоде. 
получились не среднего, а несколько меньшего размера. Во втс. 
ром поколении, т. е. при скрещивании представителей первогс 
поколения между собой, масса отдельных плодов еще более при 
близилась к массе плодов исходной мелкоплодной линии. Ра’. 
пределение массы плодов семенных гнезд, взятых с 928 растение. 
расщепляющейся популяции томатов, показано в табл. 29. 


Таблица 2: 
Ча- 4% 2 
Классы х; | стоты 1—1 НО) Га Ра —27()л= р) рл= 
КО) а а 

10 28 0,33 0,3778 0,109 0,0035 0,0264 25 

20 93 0,66 0,3209 0,430 0,0141 0,0905 84 

30 186 0,98 0,2468 0,966 0,0316 0,1571 146 

40 148 1,31 0,1691 1,716 0,0562 0,1900 176 

50 176 1,61 0,1040 2,686 0,0880 0,1830 170 

60 102 1,97 0,0573 3,869 0,1268 0,1450 134 

70 74 2,30 0,0283 5,267 0,1727 0,0977 91 

80 46 2,62 0,0129 6,880 0,2256 0,0582 54 

90 28 2,95 0,0051 8,708 0,2855 0,0291 28 
100 19 3,28 0,0018 10,745 0,3523 0,0127 12 
110 14 3,61 0,0005 13,032 0,4273 0,0043 4 
120 6 3,93 0,0002 15,476 0,5074 0,0020 2 
130 5 4,25 0,0001 18,164 0,5955 0,0011 1 
140 2 4,59 0,0000 21,068 0,6907 0,0001 1 
150 1 4,92 0,0000 24,186 0,7930 0,0000 0 
Сумма 928 — — — — 0,9972 928 


Характеристики этого распределения следующие: &=48,7 : 
5х:= 23,8, откуда а=0,6267 х==30,5. Близость 5х = 23,8 к величине 
0,674 а=20,6 позволяет предположить, что данное распределени+ 
следует закону Максвелла. Расчет выравнивающих частот {пре 
веден в табл. 29. Значения {=х;/а получены так: ѓ = 10/30,5= 
=0,328 =0,33; 4 =20/30,5=0,655 = 0,66 и т. д. Значения {(#) нах. 
дят в табл. П Приложений: {(#=0,33) == 0,3778; | (Ь==0,66) = 
= (),3209 ит. д. 

Величины предпоследней графы этой таблицы рассчитань 
следующим образом: 42= (0,33)2=0,109; &2/а=0,109/30,5= 
= (),0035; 21 (1) =2.0,3778=0,7556; (#2/а)2(Рл=0,0035-0,7556 > 
Х10= 0,0264. Умножая эту величину на п=928, получают искс 
мое значение }’=Ри=0,0264.928=25 и так до конца ряда. 

В результате получается ряд теоретически вычисленных (вь. 
равнивающих) частот }. Если эмпирические и вычисленные пс 
закону Максвелла частоты этого ряда представить графически Е 
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виде вариационных кривых, как это показано на рис. 13, можно 
убедиться в том, что они согласуются между собой. Следователь- 
но, формула (47) для нахождения выравнивающих частот этого 
ряда выбрана правильно. 


речаемости гнезд 


Частоть Ёст 
0 популяции 


10 30 50 10 90 10 130 150 
Масса гнезд, г 


Рис. 13. Эмпирическая (1) н вычислеииая по формуле Макс- 
велла (2) кривые распределения массы гнезд томатов 


11.10. ИЗМЕРЕНИЕ АСИММЕТРИИ И ЭКСЦЕССА 


Среди эмпнрических распределений асимметрия и эксцесс 
встречаются довольно часто. Заметить асимметрию и эксцесс 
можно по характеру распределения частот в классах вариацион- 
ного ряда. Графически асимметрия выражается в виде скошен- 
ной вариационной кривой, вершина которой может находиться 
левее или правее центра распределения. В первом случае асим- 
метрия называется правосторонней или положительной, а во 
втором — левосторонней или отрицательной (по знаку числовой 
характеристики). При правосторонней асимметрии ее пологая 
сторона находится правее (рис. 14), при левосторонней — левее 
центра распределения (рис. 15). 


хМо 
Рис. 14, Асимметричиая кривая Рис. 15. Асимметричная кривая 
(лоложительная аснмметрня) (отрицательная асимметрия) 
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Наряду с асимметричиыми встречаются островершинные Е 
плосковершинные распределения. Островершннность кривой рас- 
пределения вызывается чрезмерным накапливанием частот Е 
центральных классах варнацнонного ряда, вследствне чего вег 
шнна варнационной крнвой оказывается снльно поднятой ввер.. 
В такнх случаях говорят о положительном эксцессе распределе- 
ния (рис. 16). Кроме одновершинных встречаются н двух- + 
многовершинные кривые, а также плосковершинные н двигорбы: 


Х=0 
Рис. 16. Крутовершииная кривая — Рис. 17. Плосковершииная кр 
положительный эксцесс (1) в срав- вая — отрицательный эксцесс (1 
неини с иормальиой кривой (2) в сравиеиии 0 г а: кре 
во 


кривые, что свидетельствует о налнчнн у такого распределення 
отрицательного эксцесса (рис. 17). 

Велнчнна асимметрни н эксцесса может быть разлнчной, пс- 
этому важно ее не только обнаружнть, но н нзмернть. Для нзмє- 
рення аснмметрнн и эксцесса используют центральные моменте 
распределения третьего и четвертого порядков. В качестве покг 
зателя асимметрин А5 служнт центральный момент третьего пе 
рядка џз, отнесенный к кубу среднего квадратического отклоне- 
ННЯ 5х3, т. е. 


в 
Ў (0 – х) 


Аѕ=-Ё3. ——— 58. (48 


Прн строго снмметрнчных распределеннях сумма третьих сте- 
пеней отклонений вариант х; от средней арифметической 2 равн: 
нулю н Аѕ=0. Прн налнчни скошенностн распределения этот пс 
казатель будет нметь положнтельную (прн правосторонней аснух 
метрнн) лнбо отрицательную велнчнну (прн левосторонией аснх 
метрни), которая н служит мерой асимметрии. 

Показатель эксцесса, обозначаемый символом Ех, выражаел 
ся формулой 


в 
У (6 – х) 


Вх | | 5-3. (49 
5% п 
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При отсутствии эксцесса Ёх = 0. В случае положительного эксцес- 
са этот показатель приобретает положительный знак (+) и мо- 
жет иметь самую различную величину. При плосковершинности 
и двугорбости вариационной кривой коэффициеит Ех имеет отри- 
цательный знак (—); предельная величина отрицательного экс- 
цесса равна минус двум. 

Вычисление показателей асимметрии и эксцесса по формулам 
(48) и (49), т. е. способом произведений непосредственно по 
центральным моментам распределения, оказывается довольно 
трудоемким, особенно при наличии в выборке многозначных чи- 
сел. Поэтому центральные моменты обычно вычисляют косвен- 
ным путем — через условные моменты распределения, которые, 
как было показано в гл. 11, связаны определенным образом с 
центральными моментами. Вычисление условных моментов про- 
изводят по-разному в зависимости от того, каким способом — 
условной средней или способом сумм — определяют коэффици- 
енты асимметрии и эксцесса. 

При вычислении показателей 4$ и Ех способом условной 
средней А статистические моменты определяют по формулам 


= Лат; 6, У Лат; Б. Уап и = Лай, 


где а=(х:—А)/^; п— общее число наблюдений; |} — частоты 
вариационного ряда; А — классовый интервал!. Ниже приведе- 
ны соответствующие примеры. 

Пример 7. На практических занятиях студентам было пред- 
ложено измерить в миллиметрах длину отобранных наугад 200 
хвоинок сосны обыкновенной. В результате был получен вариа- 
ционный ряд, по которому рассчитывали значения показателей 
асимметрии и эксцесса. 

Определяем Ура, Хра?, Уаз и Ура“ (табл. 30). 

Пользуясь итогами этой таблицы, определяем: $1==153/ 
200==0,765; 5.=955/200==4,775; фз==1059/200=5,295 и Ва== 
==13687/200=68,435, а также Ё,2==0,5852; 6,3=0,4477; в“== 
==0,3425; 25.3==0,8954; 36,‘=1,0274; 36162==10,9586; 60,26= 
==16,7660 и 46,6: ==16,2027. Находим: 5$.2==6.—6\2==4,775— 
—0,5852 =4,1898; 5„==2,0469; 5х3 =8,5761 и 5,4= 17,5544. Пере- 
ходим к определению центральных моментов распределения: 
из=5,295—10,9586-|-0,8954 =—4,7682; ид == 68,4350—16,2027 - 
+ 16,7660 — 1,0274 == 67,9709. Отсюда Аз = — 4,7682 /8,5761 = 
==—0,5560 и Ех==67,9709/17,5544—3=3,8720—3==0,8720. Полу- 
ченные величины Аѕ и Ех показывают, что данное распределе- 


1 При вычислении коэффициентов Аз н Ех опнсаннымн способами сред- 
нее квадратнческое отклонение определяют без виесення поправкн Бесселя 
п/(п 1), не умножая на велнчнну классового ннтервала, поскольку условные 
моменты распределення 61, 62 н т. д. вычисляются без умножения на А. Этн 
приемы облегчают вычисление коэффнцнеитов асимметрии $ н эксцесса Ех, 
не отражаясь иа их величине, 
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ние имеет левостороннюю асимметрию и заметно выраженные 
эксцесс. 


Таблица 3 

Е. тона Частоты [+ а | Һа ра | Һа? | Һа 
125 2 —6 —12 72 —432 2592 
175 2 —5 —10 50 —250 1250 
225 4 —4 —16 64 —256 1024 
275 5 —3 —15 45 —135 405 
325 7 —2 —14 28 —56 112 
375 25 —1 —925 25 —25 25 
425 39 0 0 0 0 0 
475 46 +1 +46 46 +46. 46 
525 31 +2 +62 124 +248 496 
575 23 +3 +69 207 +621 1863 
625 13 +4 +52 208 +832 3328 
675 2 +5 +10 50 +250 1250 
725 1 +6 +6 36 +216 1296 
Сумма 200 — 4153 955 +41059 13687 


Пример 8. Применим способ условной средней к расчету по- 
казателей Аз и Ех для ряда распределения кальция (мгф) Е 
сыворотке крови обезьян. Необходимые данные содержатся Е 
табл. 15: Хја= 4-67; У{а?=293; У}а3=553; У{а4=2417. Отск. 
да 6, =-67/100=0,67; 6, =293/100=2,93; 63=553/100=5,55 
4 =2417/100=24,17. Находим: 61?=0,449; 63=0,301; 0,*= 
=0,202; 26,3=0,602; 36:“=0,606; 30,0:=5,889; 46:6: =14,826 
66:26. = 7,983. Отсюда уз = 5,530 — 5,839 -- 0,602 = 
==0,243; р4==24,170—14,820-{-7,893—0,606 =16,637. Определяем 
показатели вариации: $х?=6.—6:2=2,93—0,449==2,481; $=,== 
==1,575; $х3==3,908; 5;*==6,155. В результате имеем А5 =0,243 
3,908 ==-0,062; Ех==16,637/6,155—3=2,703—2==—0,297. 

В данном случае показатели асимметрии и эксцесса оказа 
лись довольно низкими, что указывает на близость этого рак 
пределения к нормальной кривой. Как будет показано в гл. У. 
это предположение полностью подтверждается. 


1.41. РАСПРЕДЕЛЕНИЕ ШАРЛЬЕ 


Среди асимметричных распределений встречаются и такиє 
которые неплохо описывает формула Шарлье: 


р = [0-68 э] . (50 


Здесь [{(Р) — функция нормированной разности і== (2—61) /5х 
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где а — отклонения классовых вариант х; от условной средней 
А, отнесенные к величине классового интервала А, т. е. а= (х;— 
—4)/^; Б,==Уја/п — условный момент первого порядка; $; — 
среднее квадратическое отклонение; п — общее число наблю- 
дений, 

Для нахождения теоретических (выравнивающих) частот по 
этой формуле необходимо: 1) вычислить ѕ,, Аз и Ех, а также 
Ва, п/5х, 45/6 и Ех/24; 2) определить для каждого класса ва- 
риационного ряда {= (а—:) /5х и величину (п/5»„)|(#), предва- 
рительно выписав из табл. П Приложений (с положительны- 
ми знаками) значения функции [(1); 3) чтобы облегчить вычис- 
ление (45/6) (22—31) и (Ех/24) (1*—6/°2--3), предварительно рас- 
считать #2, 13, #, ЗЇ и 6Р; 4) вычислить величины [1--(А5/ 
6) (13—31) ] и (Ех/24)(И—6Р-+-3); 5) определить для каждого 
класса вариационного ряда [14- (45/6) (13—31) - (Ех/24) (1*— 
—612--3)] и, умножив эту величину на (п/5){(#), найти вырав- 
нивающие частоты |’ вариационного ряда. 

Формулу (50) имеет смысл применять в тех случаях, когда 
эмпирическое распределение обнаруживает эксцесс. Если же 
распределение имеет только асимметрию, для нахождения вы- 
равнивающих частот { достаточно использовать первое слагае- 
мое формулы (50), т. е. исходить из 


Р(Х)=-2- у [1 2 (в 30] . (51) 
х 


При этом, как показывает формула (51), теоретические часто- 
ты |’ определяют умножением [1-- (45/6) (#2—3/)] на величи- 
ну (п/5х) (1). 

Пример 9. Возвращаясь к материалам примера 7 о длине 
хвоинок сосны, в котором были получены значительные вели- 
чины А5 и Ех, построим сглаживающую кривую типа распре- 
деления Шарлье с учетом только асимметричности распределения 
и затем с учетом одновременно 4$ и Ех. Характеристики этого 
ряда: 5;==2,047; Аз =— 0,5560, т. е. распределение имеет замет- 
но выраженную левостороннюю асимметрию. Рассчитать тео- 
ретические (выравнивающие) частоты для этого распределе- 
ния. Расчет приведен в табл. 31. Здесь В. =Уа/п==6,765; 
А5/6==—0,093; п/5„=97,7=98. Остальные действия понятны 
из табл. 31. 

Так как ряд распределения длины хвои у сосны обыкновен- 
ной имеет не только левостороннюю асимметрию, но и значи- 
тельный положительный эксцесс (Ех==--0,8720), следует для 
нахождения выравнивающих частот этого ряда применить фор- 
мулу (51). Расчет выравнивающих частот приведен в табл. 32. 

В данном случае Ех/24=--0,036. Остальные величины объ- 
яснены выше, 
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Таблица 3 


ыы Аз п 

а | | а-5 5, в но |2. Ао 1+—х вне траф 
= 5х х(#8—3:)| 9: 0-Ё 

314 5 6 7 8 9 10 | 11 11 
0 0] —6,765 |—3,30] —35,94[0,0017| 0,17 43,42 | 0,58 1 
1 2) —5,765 | —2,82| —22.43|0,0075| 0,74 --3,30 | 2,44] 2 
2| 8] -4,765| —2,33| —12,65 [0,026 | 2,55 |1,53 | 3,90] 4 
3 15 —3,765| —1,84| —6,23 10,073 7,151+1,07 | 7,65 8 
4] 28| 9,7651 —1,35| —2,46 10,160 | 15,68] 4-0,85 13,38] 13 
5 | 125] —1,765|—0,86| —0,64 0,275 | 26,951 --0,82 122,10] 22 
6 | 234| —0,765| —0,37| —0,05110,372 | 36,46 40,90 132,8 33 
7 | 3221 4-0,23514-0,12! 0,17 [0,396 | 38,81 | +-1,02 139,591 40 
8 | 248| +-1,235|--0,60| --0,22 15,333 | 32,63 | +4-1,15 |37,43| 37 
9 | 207| --2,235| --1,09| --1,30 [0,920 | 21,56 +1,18 125,44| 25 
10 | 130] --3,235 |5-1, 22 43,94 [0,114 | 11,17] --1,07 11,95 12 
П 221 --4,235 | +2,07| --8,87 10,047 4,61 | --0,75 | 3,46] З 
12 12] -+-5,2351-+-2,56| --16,78 10,015 1,471 0,15 | 0,23 0 
— |1353 — — — — — — 200,9! 200 
Таблица 3: 

6 А В» 

Р = б" а е ТИ і 4: х х в 

4 5 савр) Озу То 

3 4 5 6 Ф 8 | 9 10 | р! 


—3,30110,89 1118,59] 0,17| 3,49 |+-2,020 0,93 1 
—2,82| 7,95 |63,24 | 0,74] 3,30 |--0,667 2,94 3 
—2,33| 5,43 129,47 2,551 1,53 |--0,004 3,89 4 
—1,84| 3,39 111,46 7,15] 1,07 |—-0,211 6,14 6 
—1,35| 1,82 | 3,32 | 15,68| 0,85 |--0,166| 10,73 И 
—0,86] 0,74 | 0,55 | 26,95) 0,82 |—0,032] 21,24 21 
| +0,085| 35,91 36 
02 [+0,106| 43,70 44 
5 |+0,035]ј 38,57 38 
8 |—0,098 23,33 23 
7 |—0,208 9,63 10 
5 
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При сравнении эмпирических частот с частотами, вычислен- 
ыми по формулам (50) и (51), видно, что они неплохо согла- 
‘уются друг с другом. Более наглядное представление об этом 
‹ает рис. 18, на котором изображены эмпирическая (ломаная) 


я 


лом ш ч 
к 
е 


0 2 4 б 8 10 12 
Отклонения классовых вариант 


Эис, 18. Эмпирическая (1) и вычислениые по формуле Шарлье 
2, 8) кривые распределеиня длииы хвои сосиы обыкиовеиной 


я вычисленные (плавно идущие) вариационные кривые. Причем 
‘астоты, вычисленные по формуле (50), лучше согласуются с 
‚мпирическими частотами, чем частоты, вычисленные по фор- 
луле (51), что, по-видимому, связано с более полным учетом 
:нформации о форме распределения при подборе теоретической 
:ривой. 


ж ж =* 


Существуют иные способы работы с кривыми распределе- 
тия, имеющими асимметрию и эксцесс. С одним из них, опи- 
'ающимся на использование системы кривых Пирсона, можно 
знакомиться в книге А. К. Митропольского (1971). Другой 
путь, часто пригодный в тех случаях, когда наблюдается значи- 
“ельная правосторонняя асимметрия, заключается в использо- 
зании нормализующих преобразований, когда исходные вели- 
"ины признака х трансформируются в виде у==%ф(х). Конкрет- 
зый вид функции преобразования должен быть таким, чтобы 
‘рансформированная величина у имела нормальное распреде- 
ение. Среди различных возможных преобразующих функций 
занбольшее употребление нашла так называемая формула лог- 
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нормальной трансформации 
у= в (х-- Хо), 


где хо — неизвестный параметр, значение которого подбирают 
так, чтобы преобразованные значения у имели распределение, 
максимально близкое к нормальному виду. Из всех существую- 
щих способов определения хо наиболее приемлемым является 
метод квантилей, описанный Е. И. Фортунатовой!, с работой 
которой, написанной весьма доступно и снабженной числовыми 
примерами, желательно ознакомиться читателю. 


ГЛАВА 1У 


ВЫБОРОЧНЫЙ МЕТОД И ОЦЕНКА 
ГЕНЕРАЛЬНЫХ ПАРАМЕТРОВ 


1У.1. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА 


Наблюдения над биологическими объектами могут охваты- 
вать все члены изучаемой совокупности без единого исключе- 
ния или ограничиваться обследованием лишь некоторой части 
членов данной совокупности. В первом случае наблюдения на- 
зывают полными или сплошными, во втором — частичными или 
выборочными. Полное обследование совокупности позволяет 
получать исчерпывающую информацию об изучаемом объекте, 
в чем и заключается преимущество этого способа перед спосо- 
бом выборочного наблюдения. Однако к сплошному наблюде- 
нию прибегают редко, так как эта работа сопряжена с боль- 
шими затратами времени и труда, а также в снлу практической 
невозможности или нецелесообразности проведения такой ра- 
боты. Невозможно, например, учесть всех обитателей зоо- или 
фитопланктона даже небольшого водоема, потому что их чис- 
ленность практически необозрима. Нецелесообразно высевать 
всю партию семян для того, чтобы определить их всхожесть. 
В подавляющем большинстве случаев вместо сплошного наблю- 
дения изучению подвергают некоторую часть обследуемой со- 
вокупности, по которой и судят о ее состоянии в целом. 

Совокупность, из которой отбирают определенную часть ее 
членов для совместного изучения, называют генеральной. Отоб- 
ранная тем или иным способом часть генеральной совокупно- 
сти получила название выборочной совокупности или выборки. 
Общую сумму членов генеральной совокупности называют ее 
объемом и обозначают буквой М. 


! См.: Фортунатова Е, И. О преобразовании ассиметричного распреде- 
ления в нормальиое // Вопр. антропологии. 1966. № 23. С. 49—65, 
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Теоретически объем генеральной совокупности ничем не ог- 
раничен (Моо), т. е. генеральную совокупность представляют 
как бесконечно большое множество относительно однородных 
единиц или членов, составляющих ее содержание. Практически 
же объем генеральной совокупности всегда ограничен и может 
быть различным в зависимости от объекта наблюдения и той 
задачи, которую приходится решать. Например, при определе- 
нии продуктивности животных той или иной породы или вида 
генеральную совокупность составят все особи данной породы 
или вида. Если же вопрос о продуктивности животных решают 
в зоне данной области или района, то генеральную совокуп- 
ность составят все животные изучаемой породы, распространен- 
ной в данной области или районе. 

Объем выборки, обозначаемый буквой п, может быть и 
большим, и малым, но он не может содержать менее двух 
единиц. Выборочный метод — основной при изучении статисти- 
ческих совокупностей. Его преимущество перед полным учетом 
всех членов генеральной совокупности заключается в том, что 
он сокращает время и затраты труда (за счет уменьшеиия чис- 
ла ей а Главное — позволяет получать информацию 
о таких групповых объектах, сплошное обследование которых 
практически невозможно или нецелесообразно. 

Основное требование, предъявляемое к любой выборке, сво- 
дится к получению наиболее полной информации о состоянии 
генеральной совокупности, из которой выборка взята. Опыт 
показал, что правильно отобранная часть генеральной совокуп- 
ности, т. е. выборка, довольно хорошо отображает структуру 
генеральной совокупности. Однако полного совпадения выбо- 
рочных показателей с характеристиками генеральной совокуп- 
ности, как правило, не бывает. Чтобы выборка наиболее полно 
отображала структуру генеральной совокупности, оиа должна 
быть достаточно представительной, или репрезентативной (от 
лат. гергеѕепіо — представляю). Репрезентативность выборки 
достигается способом рандомизации (от англ. гапот — слу- 
чай) или случайным отбором вариант из генеральной совокуп- 
ности, что обеспечивает равную возможность для всех членов 
генеральной совокупности попасть в состав выборки. 

Существует два основных способа отбора вариант из гене- 
ральной совокупности: повторный и бесповторный. Повторный 
отбор производят по схеме «возвращения» учтенных единиц в 
генеральную совокупность, так что одна и та же единица мо- 
жет попасть в выборку повторно. При бесповторном отборе уч- 
тенные единицы не возвращаются в генеральную совокупность, 
каждая отобранная единица регистрируется только один раз. 
Повторный отбор ие влияет на состав генеральной совокупно- 
сти, и возможность каждой единицы попасть в выборку не ме- 
няется. При бесповторном отборе возможность единиц, состав- 
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ляющих генеральную совокупность, попасть в выборку меня- 
ется, так как каждый предшествующий отбор влияет на резуль- 
таты последующего, а также и на состав генеральной совокуп- 
ности, который тоже претерпевает изменения. В практике 
обычно применяют бесповторный случайный отбор. Так, если 
измеряют рост мужчин призывного возраста, то, измерив одно- 
го из них, вторично его уже не измеряют. Случайный повтор- 
ный отбор служит теоретической моделью, с помощью которой 
изучают процессы, совершающиеся в статистических совокуп- 
ностях, что имеет определенное познавательное значение. 

Идеальный случайный отбор производится по методу же- 
ребьевки или лотереи, а также с помощью таблицы случайных 
чисел, позволяющих полностью исключить субъективное влия- 
ние на состав выборки. Сущность этого метода заключается в 
следующем. На численно ограниченной, но довольно большой 
искусственной модели генеральной совокупности способом пов- 
торного случайного отбора образуется ряд чисел, которые за- 
носят в таблицу таким образом, чтобы они имели одинаковое 
количество цифр. Этим облегчается использование такой таб- 
лицы в практических целях. Например, при трехзначности чи- 
сел цифру 8 заносят в таблицу в виде 008, а число 69 — в виде 
069 и т. д. Числа записывают в таблицу в случайном порядке, 
поэтому ее и называют таблицей случайных чисел. Такая че- 
тырехзначная таблица помещена в Приложении (табл. ІҮ). 

Как пользоваться этой таблицей? Пусть из общего числа 
120 животных, содержащихся в виварии, нужно отобрать для 
опыта 10 особей. Для того чтобы отбор был действительно слу- 
чайным, исключающим субъективные влияния на состав выбор- 
ки, необходимо поступить следующим образом. Всем животным 
вивария или только животным той группы, из которой намечено 
отобрать 10 особей, присваивают номера от | до п. Затем в 
таблице случайных чисел находят десять таких, которые не 
превышают п. Пусть п= 120. Пользуясь табл. ГУ, условӣмся 
учитывать первые три цифры в каждом столбце этой таблицы 
(хотя можно исходить и из другого условия). В первом столб- 
це находят числа 0905 и 0912. Согласно условию, это дает 
числа 90 и 91. Других нужных чисел в этом столбце нет. Во 
втором столбце таблицы находят числа 47 и 41. В третьем 
столбце обнаруживают числа 62, 84, 50 и 31. В четвертом 
столбце отыскивают остальные два числа: 39 и 87. Всего полу- 
чилось десять чисел: 90, 91, 47, 41, 62, 84, 50, 31, 39 и 87. Осо- 
бей с такими номерами включают в состав экспериментальной 
группы. 

Наряду с простым случайным отбором в практике применя- 
ют и другие виды выборки из генеральной совокупности. К ним 
относится типический, серийный и механический отбор. Типиче- 
ский отбор используют в тех случаях, когда генеральная со- 
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вокупность расчленяется на отдельные (типические) группы. 
Например, в хозяйстве среди крупного рогатого скота находят- 
ся первотелки, группы коров по второму, третьему и другим 
отелам. В таких случаях из каждой группы случайиым способом. 
отбирают одинаковое, а чаще пропорциональное число единиц. 
Затем вычисляют групповые характеристики, объединяемые в 
общую характеристику генеральной совокупности. 

При серийном отборе, как и при типическом, генеральную 
совокупность предварительно делят на группы (серии, гнезда), 
образуемые обычно по территориальному принципу. Затем по 
усмотрению исследователя из общего количества серий или 
гнезд отбирают некоторое их число для совместной обработки. 
При этом серии могут быть как равночисленными, так и со- 
стоять из разиого числа единиц. Например, из 30 групп под- 
ростков в возрасте от 14 до 15 лет намечено обследовать вы- 
борочно шесть групп. Членов этих групп и объединяют для 
совместного изучения. Таким образом, в отличие от типическо- 
го отбора при серийной выборке из геиеральной совокупности 
извлекают не отдельные единицы, а целые серии или гнезда 
относительно однородных единиц. 

При механическом отборе генеральная совокупность разби- 
вается на несколько равных частей или групп. Затем из каждой 
группы случайным способом отбирают по одной единице, На- 
пример, при обследовании посева ржи на урожайность намече- 
но отобрать 100 растений (или колосьев). В таком случае поле 
ржи должно быть разбито на сто равных делянок. Следова- 
тельно, при механическом отборе число единиц равно числен- 
ности групп, на которые разбита генеральная совокупность. 
Механический отбор может производиться и по другой схеме, 
когда в выборку попадает каждая десятая, сотая и т. п. еди- 
ница генеральной совокупности. Например, при проведении бо- 
танических или зоологических экскурсий можно регистрировать 
каждый пятый, десятый и т. п. экземпляр встреченных расте- 
ний или животных данного вида, 

Кроме типического, серийного и механического отбора в 
практике применяют и другие разновидности случайной вы- 
борки. 


17.2. ТОЧЕЧНЫЕ ОЦЕНКИ 


Числовые показатели, характеризующие генеральную сово- 
купность, называют параметрами, а числовые показатели, ха- 
рактеризующне выборку — выборочными характеристиками или 
статистиками. Выборочные характеристики являются прибли- 
женными оценками генеральных параметров. Это величины 
случайные, варьирующие вокруг своих параметров. Оценки ге- 
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неральных параметров по выборочным характеристикам могут 
быть точечными и интервальными. 

Генеральные характеристики, или параметры, принято обоз- 
начать буквами греческого алфавита, а выборочные характе- 
ристики — латинского. Выборочная средняя Х является оценкой 
генеральной средней и, выборочная дисперсия 5,2 — оценкой 
генеральной дисперсии вх’, а среднее квадратическое отклоне- 
ние 5, —оценкой стандартного отклонения с», характеризую- 
щего генеральную совокупность. Это точечные оценки, пред- 
ставляющие собой не интервалы, а числа («точки»), вычисляе- 
мые по случайной выборке. 

Требоваиия, предъявляемые к точечным оценкам. Выбороч- 
ные характеристики как величины случайные, варьирующие 
вокруг своих генеральных параметров, в основном не совпада- 
ют с ними по абсолютной величине. Оценки должны удовлет- 
ворять по меньшей мере следующим требованиям: быть состоя- 
тельными, эффективными и несмещенными. 

Для пояснения смысла этих свойств необходимо рассмот- 
реть понятие выборочного распределения некоторой статисти- 
ки. Пусть из бесконечно большой генеральной совокупности 
случайным образом извлекается большое число выборок, каж- 
дая из которых включает одно и то же количество наблюдений 
п. В каждой из этих выборок вычисляют значение статистики 
и. В силу случайных причин эти величины будут варьировать, 
образуя некоторое распределение, которое называют выбороч- 
ным распределением статистики. 

В тех случаях, когда распределение анализируемого приз- 
нака ие слишком сильно отличается от нормального вида, а 
объем выборок не слишком мал, очень часто выборочные рас- 
пределения многих статистик оказываются нормальными. По- 
этому их свойства можно описать только двумя параметрами: 
математическим ожиданием статистики ии и ее дисперсией би?. 

Точечная оценка статистики называется состоятельной, ес- 
ли при увеличении объема выборки она стремится к величине 
генерального параметра. Так, для генеральной средней р со- 
стоятельной оценкой является выборочная средняя Хх, для гене- 
ральной дисперсии о»? состоятельной оценкой будет выбороч- 
ная дисперсия 5,2. Точечная оценка называется эффективной, 
если она имеет наименьшую дисперсию выборочного распреде- 
ления по сравнению с другими аналогичными оценками, т. е. 
обнаруживает наименьшую случайную вариацию. Так, из трех 
показателей, описывающих положение цеитра нормального рас- 
пределения некоторого признака Х (средней арифметической, 
медианы и моды), наиболее эффективной оказывается первая 
ў, наименее эффективной — последняя Мо, так как для дислер- 
сий этих оценок характерно о?;<о?ме<о?мо. Оценка называ- 
ется несмещенной, если математическое ожидание ее выбороч- 
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ного распределения совпадает со значением генерального па- 
раметра. 

Выборочная средняя является несмещенной оценкой гене- 
ральной средней, тогда как выборочная дисперсия представля- 
ет собой смещенную оценку относительно генерального пара- 
метра на величину л/ (л —1). Чтобы получить несмещенную 
оценку генеральной дисперсии, нужно при вычислении выбороч- 
ной дисперсии, а следовательно, и среднего квадратического 
отклонения сумму квадратов отклонений (девиату) относить не 
к числу наблюдений п, а к числу степеней свободы (ё=п-—1). 

Статистические ошибки. Выборочные характеристики, как 
правило, не совпадают по абсолютной величине с соответствую- 
щими генеральными параметрами. Величину отклонения выбо- 
рочного показателя от его генерального параметра называют 
статистической ошибкой или ошибкой репрезентативности. Ста- 
тистические ошибки присущи только выборочным характери- 
стикам, они возникают в процессе отбора вариант из генераль- 
ной совокупности. 

Для измерения ошибки репрезентативности некоторой ста- 
тистики может служить дисперсия выборочного распределения 
си? или найденное на ее основе значение среднего квадратиче- 
ского отклонения, которое называют также квадратической 
ошибкой статистики си. Его величина показывает, насколько 
велика случайная вариация отдельных оценок по отношению к 
центру выборочного распределения, совпадающего со значе- 
нием генерального параметра, если статистика несмещенная. 

Из теории математической статистики известно, что в том 
случае, когда распределение исходного признака Х не слишком 
сильно отличается от нормального вида, а объем выборки не 
слишком мал (на практике п>30), квадратическая ошибка 
репрезентативности средней арифметической может быть най- 
дена по формуле 

8. 


= =. (59) 


$х 

Ут п 
Эта формула трансформируется в несколько рабочих формул, 
из которых особенно удобны следующие: 
(5 7х)? 
2 х. Е . 
ей п __ Хх) 


$. = — = 


* п(п — 1) п (п — 1) 
УВЕ е 


1 Ошибку средией арифметической обозиачают также буквой т, 


— ДУ $- = 
в; 22 8: 
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Приведенные формулы применяют при вычислении ошибки 
средней арифметической способом произведений. Они пока- 
зывают, что при простой случайной выборке величина ошибки 
зависит как от объема выборки, так и от размаха варьирова- 
ния признака в генеральной совокупности. 

Пример 1. Выше было найдено (см. пример 16 в гл. П), 
что среднее число поросят в опоросах 64 свиноматок равно 8,25. 
Определим ошибку для этой средней. Величины Хѓ;х;==528 и 
Уһ? = 4574 находятся в табл. 12. Подставляя их в формулу 
(53), находим 


НЕЕ (574 Е в) 50574 4356) = 50,054. 
64.63 64 4032 


Отсюда 5.=) 0,054 =0,233.Среднюю арифметическую, сопро- 


вождаемую ошибкой, записываем так: Х-5х == (8,250,233) 
поросят. 

Если среднюю арифметическую вычисляют способом услов- 
ной средней А, ее ошибку вычисляем по следующей формуле: 


эра ФИО 


с те а = ее си 
(54) 


Пример 2. Выше было найдено (см. табл. 15), что содержа- 
ние кальция в сыворотке крови обезьян в среднем равно == 
—11,94 мг%. Определим ошибку для этой средней. В табл. 15 
находим: Хја=--67; У{а?==293; п=100. Подставляем эти дан- 


2 1 293 67 \2 1 
ные Ш. ОЗ 
ные в формулу (53): 5 5 | т ( 99) | 99 (2,93 
— 0,45) = а 0, 025. Отсюда === 10,095 — —0,158. 


При РЕВ отборе вариант из численно ограничен- 
ной генеральной совокупности ошибка выборочной средней, оп- 
ределяемая по формуле (53), оказывается несколько завышен- 
ной, особенно в тех случаях, когда объем выборки достаточно 
велик (п2>25% от М). Учитывая это обстоятельство, К. Пир- 
сон (1898) предложил поправку (М№—п) / (1—1), которую в 
этом случае необходимо вносить в качестве множителя в фор- 
мулу (52). При этом вместо (М№—п) /(М№—1) можно использо- 
вать приближенную величину 1—п/М, где п/№ — доля выборки, 
т. е. вычислять ошибку средней по формуле 


5.= т у 1—5. (55) 
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Чем больше доля выборки, тем сильнее скажется поправка 
на величине ошибки средней. Если же доля выборки мала, что 
наиболее часто встречается в практике, поправка оказывается 
близкой к единице и величина ошибки средней практически не 
изменится. Поэтому в тех случаях, когда объем генеральной 
совокупности № достаточно велик по сравнению с объемом вы- 
борки п, величина поправки 1—п/М будет близка к единице и 
ею можно пренебречь. 

Пример 3. Из общего числа 500 мужчин, подлежащих при- 
зыву на военную службу, выборочно изменен рост у 80 чело- 
век. Средний рост призывников оказался равен 170 см с дис- 
персией 66,3. Определим ошибку для этой средней: 


66,3 СУУС 
„У (1-1) 1—9) —У5.529:0840-=/ 0.696 —0,834. 


Если же у = средней вычислить без поправки Пирсона, она 
оказывается следующей: 


з: =У 66,3/80=0,829=0,910. 
Иногда возникает необходимость объединить несколько 
групповых средних с их ошибками. В таких случаях для опре- 


деления ошибки общей (невзвешенной) средней х, если выбор- 
ки равновелики, применяют формулу 


= И яя +, (56) 


где А — число слагаемых групповых аы: 
Пример 4. На трех независимых равновеликих выборках по- 
лучены следующие средние: х= 10,20,12; Х2== 11,50,18; х== 
—=13,1--0,09. Общая средняя для этих выборок х== (1/3) (10,2-- 
-+11,5-- 13,1) =11,6; ее ошибка 
=(1/3)У 0,122--0,182-- 0,09 =(1/3) У 0,055 ==0,078. 
Ошибку взвешенной средней из суммы частных или группо- 
вых средних определяют по формуле (52), в которой вместо 
5х? берут взвешенную дисперсию $5,2; ее определяют по фор- 
муле 
2 (у — 1) 82 —— (по — 1) 82 +... 4 (пь — 1) 82 


р-н 
У3 Лг— 7 
11 
А 
Ў) (п; — 1) 8 
=; , (57) 
>) пру 


і=1 
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где пл; — объемы независимых выборок из нормально распред= 
ляющейся генеральной совокупности; 5:7 — дисперсии этих вь 
борок; у — число ограничений свободы вариации, равное числ' 
независимых выборочных групп. При известном объеме гене- 


ральной совокупности М ошибка общей взвешенной средней ; 
определяется по формуле 


52 


х п й 
5; - (: х): (587 

Пример 5. Проводили учет урожая пшеницы на корню. По- 
ле было разбито на пять типовых участков (групп). Каждыг 
участок, в свою очередь, был разделен на более мелкие участ 
ки (метровки), из которых случайным бесповторным способом 
отбирали пропорциональное (по объему групп) количество к‹- 
лосьев с последующим взвешиванием массы содержавшихся + 
них зерен (в граммах). Результаты отбора и нх обработка при- 
ведены в табл. 33. 


Таблица 3: 
Численность Выборочные показатели 
Типовые (п.—1)5 
участки‘ групп выборки ра дисперсия і і 
М т средняя х 52 


Сумма 1 000 200 — — 725, 


Взвешенная средняя 


о 20.9,8 -|- 40-8,5 + 80,7,7 + 30-12,1 30.10,2__ 


20 -- 40 + 80 -- 30 -- 30 
=—1821.0 0 1059,11 г. 
200 


Чтобы определить ошибку этой величины, нужно сперва рассчи- 
тать взвешенную дисперсию: &,2==725,7/(200—5) =3,72. Под 
ставляя нужные величины в формуле (58), находим ошибк‘ 
взвешенной средней: 


3,72 200 \ чута а ЛИР СТЯ8Я — 
5: і! тос) = 6,0186 0,80=—0,01488=0,122. 


Статистические ошибки характеризуют варьирование выбь. 
рочных показателей вокруг своих генеральных параметров. Он; 
обладают теми же свойствами, что и среднее квадратическох 
отклонение. Чем сильнее варьирует признак, тем больше пре 
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прочих равных условиях будет ошибка выборочных показате- 
лей, и, наоборот, при слабом варьировании признака ошибка 
выборочных показателей окажется меньше. Одно лишь свойство 
специфично для ошибок репрезентативности: они уменьшаются 
при увеличении объема выборки, т. е. при поо, 55-0. Это 
свойство статистических ошибок обусловлено действием закона 
больших чисел, по которому наиболее вероятный результат 
получается при наибольшем числе испытаний. Отсюда понятно 
значение ошибки: она указывает на точность, с какой выбороч- 
ный показатель репрезентирует генеральный параметр. Чем 
меньше ошибка, тем ближе выборочная характеристика к ве- 
личине генерального параметра, и, наоборот, чем больше ошиб- 
ка, тем менее точно выборочная характеристика репрезенти- 
рует генеральный параметр. 

Показатель точности оценок. Судить о точности, с какой 
определена та или иная выборочная средняя, позволяет отно- 
шение ошибки репрезентативности к своей средней. Этот пока- 
затель, обозначаемый символом С5 (обычно выражен в процен- 
тах), определяют по одной из следующих формул: 


5. 


Св =—2—100; (59) 
Сз = (60) 


Здесь Со — коэффициент вариации, выраженный в процентах, 
п — объем выборки. 

Пример 6. Сравнивают на точность определения средние: 
== (86,1--0,7) см и Хх. == (17,4-+0,2) г. Так как средние выра- 
жены разными единицами, судить по абсолютной величине их 
ошибок о том, какая из них определена более точно, нельзя. 
Ответить на этот вопрос позволяет коэффициент Сз: 


Сз= 027 100==0,81%; Сз=-0:2.100= 1,15. 
86,1 17,4 

Из расчетов видно, что первая средняя определена более 
точно, чем вторая. 

Показатель точности Сѕ нашел широкое применение осо- 
бенно при сравнительной оценке результатов сельскохозяйст- 
венных опытов. Точность средних показателей, которыми оце- 
нивают результаты наблюдений, считают вполне удовлетвори- 
тельной, если коэффициент С не превышает 3—5%. 

Коэффициент С$ сопровождается ошибкой 5с‹, которую оп- 
ределяют по формуле 


1 Сз \2 
=з 5. а) . (61) 
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Ошибками репрезентативности сопровождаются и другие выбо- 
рочные показатели, из которых необходимо отметить следую- 
щие. 


Ошибка медианы — зи.==5:У [2 ==1,25335„/У п. (62) 
Ошибка дисперсии 825% / Уп. (63) 


Ошибка среднего квадратического отклонения $;= (64) 


$х 
У? ` 


Ошибка коэффициента вариации 


аут Уу. в 


Ошибка выборочной доли $„= и 2020 = рап (66) 
или с поправкой Пирсона р 2 (1 — г. А (67) 
в 
Ошибка выборочной доли, выраженной в процентах, 
з 2002). (68) 
Ошибка абсолютной частоты 5 == И т = пр(1— р). 
(69) 


[У.3. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ 


Доверительный интервал для генеральной средней. По из- 
вестным выборочным характеристикам можно построить интер- 
вал, в котором с той или иной вероятностью находится гене- 
ральный параметр. Вероятности, признанные достаточными для 
уверенного суждения о генеральных параметрах на основании 
известных выборочных показателей, называют доверительны- 
ми. Понятие о доверительных вероятностях предложено Р. Фи- 
шером. Оно вытекает из принципа, который положен в основу 
применения теории вероятностей к решению практических за- 
дач. Согласно этому принципу, маловероятные события счита- 
ют практически невозможными, а события, вероятность которых 
близка к единице, принимают за почти достоверные. Обычно в 
качестве доверительных используют вероятности Р,==0,95; Рз = 
=0,99 и Рз==0,999. Это означает, что при оценке генеральных 
параметров по известным выборочным показателям существует 
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риск ошибиться в первом случае один раз на 20 испытаний, во 
втором — один раз на 100 испытаний и в третьем — один раз на 
1000 испытаний. 

Доверительным вероятностям, как это видно из табл. І При- 
ложений, соответствуют следующие величины нормированных 
отклонений: 


вероятности Р,== 0,95 соответствует В == 1,96; 
вероятности Р.== 0,99 соответствует # == 2,58; 


вероятности Рз== 0,999 соответствует В == 3,29. 


Выбор того или иного порога доверительной вероятности ис- 
следователь осуществляет исходя из практических соображе- 
ний той ответственности, с 
какой делаются выводы о 
генеральных параметрах. 

С доверительной вероят- 
ностью тесно связан уро- 
вень значимости а, под ко- 
торым понимают разность ,.,,„ 
а = 1—Р. Геометрически а 
(рис. 19) эта величина 
представляет площадь под х-!,965; |. х Х- 119655 
нормальной кривой выбо- Доверительный интервал 
рочного распределения не- (2= 095 
которой статистики, выхо- рис, 19. 95%-ный доверительный иитер- 
дящую за пределы той его валв границах от =—1,965- до 2+ 1,965= 
части, которая включает нормальной кривой 
Р этой площади. Так, для 
і== 1,96 отклонения от центра нормального распределения вклю- 
чают 95% его площади. За пределами этих границ по обе сто- 
роны находится по 2,5% указанной площади, составляя тем са- 
мым 5%-ный уровень значимости. 

Учитывая, что выборочное распределение некоторой стати- 
стики, например средней арифметической величины, при доста- 
точно больших объемах выборок имеет нормальную форму, 
можно записать выражение 


р= 0,025 
РА 


Т Е А 


Это выражение означает, что вероятность того, что средняя 
х, найденная по выборке, отклонится случайным образом от 
центра р на какую-то долю квадратической ошнбки 5х, может 
быть оценена через нормированное значение по таблицам нор- 
мального распределения. Отсюда можно утверждать, что гене- 
ральная средняя д находится с этой вероятностью в интервале 
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ХФ. << х- 15; или 


х=: «рх т. | (70) 


Величины Х и $, определяют по выборке, а Ё зависит толь- 
ко от одного из трех значений доверительной вероятности 0,95; 
0,99; 0,999, принимая величины 1,96; 2,58; 3,29. 

Пример 7. Распределение кальция в сыворотке крови обезь- 
ян, как было установлено выше, характеризуется следующими 
выборочными показателями: х==11,94 мг%; $„,==1,27; п==100. 
Построим 95%-ный доверительный интервал для генеральной 
средней р этого распределения: 


11,94 — 196 << И, +196 или 11,70<6<12,18. 

Следовательно, с вероятностью Р==0,95, или 95%, можно 
утверждать, что генеральная средняя данного нормального рас- 
пределения находится между 11,70 и 12,18 мгф. Это довольно 
узкий доверительный интервал. Можно утверждать, что выбо- 
рочная средняя Х==11,94 мг% является достаточно точной оцен- 
кой генерального параметра. На это указывает и показатель 
точности средней 


5 1,27 7100 _ Д 
О ое =1,05 %. 


Доверительный интервал для генеральной дисперсии и стан- 
дартного отклонения. Доверительный интервал для дисперсии 
нормально распределяющейся генеральной совокупности мож- 


но представить в таком виде: Рн=<о?,<Рь, где Рив -— 52 
хХИ2т — нижняя, а Р,=52 4-15 / 2/п — верхняя границы до- 
верительного интервала. 

Пример 8. Определить границы 95%-ного доверительного 
интервала для генеральной дисперсии распределения кальция 
(мг%) в сыворотке крови обезьян. Для этого распределения 
п==100 и 5?,=1,60. Ошибка выборочной дисперсии $. =1,60 х 
ху 2/100= 1,60.0,1414=0,226. Отсюда Р„=1,60—1,96.0,226 = 
= 1,60—0,44 =1,16 и Рь=1,60+0,44=2,04. Границы доверитель- 
ного интервала для стандартного отклонения оказываются сле- 
дующие: Р,=[/ 1,16=1,08 и Р,„=У2,04=1,43. 

Более точно доверительный интервал для генеральной дис- 
персии строят с применением %2(хи-квадрат)-критерия Пирсона 


(см. гл. У). Критические (процентные) точки для этого кри- 
терия приведены в табл. УЦ Приложений. Они рассчитаны для 
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разных уровней значимости о и соответствующих порогов дове- 

рительной вероятности Р. 

‚ При использовании критерия у? для построення доверитель- 

кого интервала применяют двусторонний уровень значимости, 

т, е. «=2,5% (для Р.) и Р=100—2,5=97,5% (для Рь) 95%-но- 

го интервала. Границы 95%-ного доверительного интервала 

определяют по формулам 

п 2 

вое 

2,5 


, 


; Иво 


2 РД 
197,5 


где $2, — выборочная дисперсия, п — объем выборки. 

Пример 9. В рассмотренном примере 8 применим описанный 
способ к определению границ 95%-ного доверительного интер- 
вала для генеральной дисперсии ряда распределения кальция 
(мгф) в сыворотке крови обезьян. Имеем п=100; (и —1)52,= 
=991,60= 158,40. В табл. УП Приложений для п 1=99 и 
а==2,5%4 находим х2=128,42 и для Р=97,54 — х2==73,36. Отсю- 
да Р„=158,40/128,42=1,23 и Рь=158,40/73,36 ==2,16. Границы 
доверительного интервала для стандартного отклонения оказы- 


ваются следующими: Р,=У 1,23=1,11; Р,=У 2,16== 1,47. 


Доверительный интервал для коэффициента вариации. Гра- 
ницы доверительного интервала для генерального коэффициен- 
та вариации Со определяют по следующим формулам: 


Су Сә 
Рр =, Р ——ж——— 
а 1+ КУ 1262 ’ в 1 -КУТ- 26% ’ 
і = 
где =——; С9==5,/х. 
ое } 


Пример 10. Коэффициент вариацин, характеризующий варь- 
ирование кальция (мг%) в сыворотке крови обезьян, оказался 
равным 10,6%, илн Со= 0,106. Определим границы 95%-ного 
доверительного интервала для генерального параметра Со. 


1,96 
Предварительно вычисляем величин = 0,139. 
ВС УК = уу 
Подставляем известные значения в формулы: 
= 0,106 0,106 
и р+0,139 УТ--2 (0,106)2 1 0, 139.0,11 
0,106 
=—^ —0,093, или 9,3%; 
1,141 % 
р — 0,106 __ 0,106 
8 10,139 УТ-Е2 (0,106) 1—0, 141 
0,106 
= —2————==0),103, или 123%. 
0,859 А % 
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Это означает, что при повторных выборках в данных усло- 
виях коэффициент вариации не превысит 12,3% и не окажется 
ниже 9,3%. Довольно узкий доверительный интервал (9,3— 
12,3%) указывает на то, что выборочный коэффициент вариа- 
ции Си=10,6ф достаточно точно репрезентирует генеральный 
параметр Си. 

Доверительный интервал для доли. Доля — это средняя, ко- 
торая характеризует количество единиц в выборке, имеющих 
учитываемый признак. Общее число таких единиц в генераль- 
ной совокупности составляет генеральную долю (р=т/М). 
Границы доверительного интервала для генеральной доли — 
Р.< РР, — определяют так же, как и для генеральной сред- 
ней рядовой изменчивости, т. е. Ри=р—15т и Рь=р-+-Ё5т. Эти 
формулы применяют тогда, когда выборочные доли р и 4 рав- 
ны между собой или незначительно отклоняются от 50%-ной 
численности групп. Если же это условие не выполняется (при 
75% <р<25%), доверительные границы для генеральной доли 
следует определять по формуле 


2 в 9 т (п — т) 2 
тг (=) ер п +]. о 


где и — число наблюдений; т — абсолютная численность одной 
из групп; ѓ — нормированное отклонение, определяемое по зна- 
чению вероятности (Р). 

Пример 11. В рабочем поселке с № числом жителей спосо- 
бом бесповторного случайного отбора было обследовано 150 че- 
ловек, из которых 20 оказались больными. Определить вероят- 
ные границы генеральной доли больных в данном населенном 
пункте. Выборочная доля больных р==т/п=20/150=0,13, или 
13%. Исходим из Р 0,95 и соответственно #=1,96 2х 2. Подстав- 
ляя известные данные в формулу (71), находим 


І 4 \ 20(150—20) 4 
ВР — = —_— —. |= 
150 +4 1(20- И 150 +4) 
1 —5 1 5 А 
=-—— (22 + 2 —=-——— (22 6) =0,143 + 0,056. 
не (22527 183) = "(22 + 8,56)—0,148 + 0.05 


Отсюда границы доверительного интервала оказываются 
следующимн: Ри=0,143—0,056 =0,087, или 8,7%; Рь=0,143-+ 
+0,056 =0,199, или 19,9%. 

Таким образом, с вероятностью Р =95% можно утверждать, 
что генеральная доля больных находится между границами от 
8,7 до 19,9% от общего числа лиц М, проживающих в данном 
населенном пункте, 


ГЛАВА У 
КРИТЕРИИ ДОСТОВЕРНОСТИ ОЦЕНОК 


\У.4. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И ИХ ПРОВЕРКА 


В гл. ГУ было показано, что выборочные характеристики 
являются оценками генеральных параметров, которые, как пра- 
вило, остаются неизвестными. Там же описаны точечные и ин- 
тервальные способы оценки неизвестных параметров по значе- 
ниям выборочных характеристик '. 

Ниже будут обсуждаться сравнительные оценки генераль- 
ных параметров по разности, наблюдаемой между сравнивае- 
мыми выборками. Это важно, так как ни одно исследование не 
обходится без сравнений. Сравнивать приходится данные опы- 
та с контролем, урожайность одной культуры с урожайностью 
другой, продуктивность одной группы животных с продуктив- 
ностью другой и т. д. 

О преимуществе той или иной из сравниваемых групп судят 
обычно по разности между средними долями и другими выбо- 
рочными показателями — величинами случайными, сопровожда- 
емыми ошибками репрезентативности. 

Вопрос о достоверности выборочной разности с ее ошибкой 
приходится решать исходя из той или иной гипотезы, т. е. пред- 
положения или допущения относительно параметров сравнивае- 
мых групп, которое выражено в терминах вероятности и может 
быть проверено по выборочным характеристикам. 

В области биометрии широкое применение получила так 
‘называемая нулевая гипотеза (Но). Сущность ее сводится к 
‘предположению, что разница между генеральными параметра- 
ми сравниваемых групп равна нулю и что различия, наблюдае- 
мые между выборочными характеристиками, носят не систе- 
‘матический, а исключительно случайный характер. Так, если 
одна выборка извлечена из нормально распределяющейся сово- 
купности с параметрами их и о», а другая — из совокупности 
с параметрами пу и оу, то нулевая гипотеза исходит из того, 
ЧТО ре = ру И бх=0у, Т. её. их —ру=0 и ох—0у==0 (отсюда и на- 
звание гипотезы — нулевая). 

Противоположная нулевой — альтернативная гипотеза 
(На) — исходит из предположения, что рх —и,50 и вх— 0,50. 

Для проверки принятой гипотезы, а следовательно, и досто- 
верности оценки генеральных параметров по выборочным дан- 
ным используют величины, функции распределения которых 


1 В настоящем пособии термии «оценка» применяется в двояком смысле: 
и как собствеиио оцеика, выражаемая числом, и как самый процесс оцеиива- 
ния геиеральных параметров по выборочиым показателям, 
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известны. Эти величины, называемые критериями достоверно- 
сти, позволяют в каждом конкретном случае выявить, удовле- 
творяют ли выборочные показатели принятой гипотезе. Функ: 
ции распределения указанных величин табулированы, т. е 
сведены в специальные таблицы, где содержатся значения функ- 
ции для разных чисел степеней свободы А или объема выбор. 
ки п и уровней значимости о. 

Уровень значимости, или вероятность ошибки, допускаемой 
при оценке принятой гипотезы, может различаться. Обычно 
при проверке статистических гипотез принимают три уровня 
значимости: 5%-ный (вероятность ошибочной оценки Р = 0,05), 
1%-ный (Р= 0,01) и 0,1%-ный (Р=0,001). В биологических 
исследованиях часто считают достаточным 65%-ный уровень 
значимости. При этом нулевую гипотезу не отвергают, если в 
результате исследоваиия окажется, что вероятность ошибочно- 
сти оценки относительно правильности принятой гипотезы пре- 
вышает 5%, т. е. Р>>0,05. Если же Р<0,05, то принятую гипо- 
тезу следует отвергнуть на взятом уровне (о). Ошибка при 
этом возможна не более чем в 5% случаев, т. е. она малове- 
роятна. 

При более ответственных исследованиях уровень значимости 
может быть уменьшен до | или даже до 0,1%. Трем упомяну- 
тым уровням значимости (о) отвечают (при нормальности рас- 
пределения используемого критерия) нормированные отклоне- 
ния (1): при о! (Р=0,05) нормированное отклонение & = 1,96; 
при аз (Р= 0,01) —&=2,58; при аз (Р=0,001) — &=3,29; и 
соответственно пороги доверительной вероятности (1—о) рав- 
НЫ Р, = 0,95, Р,= 0,99 и Р, = 0,999. 

В области биометрии применяют два вида статистических 
критериев: параметрические, построенные на основании пара- 
метров данной совокупности (например, Х и 52,) и представля- 
ющие функции этих параметров, и непараметрические, пред- 
ставляющие собой функции, зависящие непосредственно от ва- 
риант данной совокупности с их частотами. Первые служат 
для проверки гипотез о параметрах совокупностей, распределя- 
емых по нормальному закону, вторые — для проверки рабочих 
гипотез независимо от формы распределения совокупностей, из 
которых взяты сравниваемые выборки. Применение параметри- 
ческих критериев связано с необходимостью вычисления выбо- 
рочных характеристик — средней величины и показателей вари- 
ации, тогда как при использовании непараметрических крите- 
риев такая необходимость отпадает. 

При нормальном распределении признака параметрические 
критерии обладают большей мощностью, чем непараметриче- 
ские критерии. Они способны более безошибочно отвергать 
нулевую гипотезу, если она не верна. Поэтому во всех случаях, 
когда сравниваемые выборки взяты из нормально распределя- 
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ющихся совокупностей, следует отдавать предпочтение пара- 
метрическим критериям. 

В случае очень больших отличий распределений признака 
от нормального вида следует применять непараметрические 
критерии, которые в этой ситуации оказываются часто более 
мощными. В ситуациях, когда варьирующие признаки выража- 
ются не числами, а условными знаками, применение непара- 
метрических критериев оказывается единственно возможным. 

Из параметрических критериев в биометрии применяют 
і-критерий Стьюдента и Е-критерий Фишера. Первый исполь- 
зуют для сравнительной оценки средних величин, второй — для 
оценки дисперсий. Ниже рассмотрен отдельно каждый из этих 
критериев. 


У.2. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 


і-критерий Стьюдента ({-распределение). Использование 
формулы Гаусса— Лапласа (44) для сравнительной оценки 
средних величин затруднено тем, что в качестве аргументов в 
эту формулу входят генеральные параметры и и с (которые, 
как правило, остаются неизвестными), тогда как при обработ- 
ке и сравнении выборочных групп приходится пользоваться не 
генеральными, а выборочными характеристиками Х и $». Учи- 
тывая это обстоятельство, английский математик В. Госсет 
(печатавшийся под псевдонимом Стьюдент), в 1908 г. нашел 


х — о 
закон распределения величины #=-^—№_, в которой гене- 


суп 
ральный параметр с заменен на его выборочную характеристи- 
КУ 5, т. е. нашел закон распределения значений 


х 
=, (72) 
5 уп 
Оказалось, что отношение разности между выборочной и 
генеральной средними к ошибке выборочной средней непрерыв- 
но распределяется согласно следующей формуле: 
п-1 


) 2 для ооо, 


#2 
1 


ле=с( 1+ 


где С — константа, зависящая только от числа степеней свобо- 
ды А=и— 1. 

Открытый Стьюдентом и теоретически обоснованный Р. Фи- 
шером закон {-распределения служит основой так называемой 
теории малой выборки, которая характеризует распределение 
выборочных средних в нормально распределяющейся совокуп- 
ности в зависимости от объема выборки. ѓ-распределение завя- 
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сит только от числа степеней свободы Ё=и—1, причем с уве 

личением объема выборки п {-распределение быстро приближг- 

ется к нормальному с параметрами џр=0 и о=| и уже прі 

п2230 не отличается от него. Это видно из табл. 34, в которо 

наряду с табулированными значениями функции нормальног‹ 

| распределения приведены табули 

рованные значения {-распределения 
для разных значений #. 

Более наглядное представление 

о характере {-распределения дает 


< 


— ых — 
і 1х0 +1 +200 *П 


Рис. 20. Кривая ї-распределе- 
ния (1) при п=3 на фоие иор- 


рис. 20, на котором на фоне нор 
мальной кривой изображена (более 
пологая) кривая {-распределения 
при п==3. [распределение симмет- 
рично и отражает специфику рас 


мальной кривой (2) пределения средней арифметиче 


ской в случае малой выборки взг 
висимости от ее объема (п). Для выборок, объем которых пр= 
выщает 30 единиц, величина { распределяется нормально и не 
зависит от числа наблюдений. Если же п< 30, характер {-раг 
пределения находится в зависимости от числа наблюдений ғ 


Таблица 3+ 
Нормированное отклонение $ 
Распределение 
0,5 1,0 1,5 2,0 2,5 3,0 3,5 

Нормальное 383 | 683 | 866 | 955 | 988 | 997 | 9995 
Стьюдента прн 

п==:8 338 | 577 728 | 816 | 870 | 905 | 927 

п==20 377 | 670 850 | 940 978 | 993 | 998 

п=30 383 | 683 | 866 | 955 988 | 997 19995 


Примечание. Значения фуикции даны чнслами после запятой. 


Для практического использования {-распределения составле 
на специальная таблица (см. табл. У Приложений), в которое 
содержатся критические точки (1:1) (от англ. ѕіапӣагӣ — ног 
ма, образец) для разных уровней значимости © и чисел степе- 
ней свободы А. Как пользоваться этой таблицей в разных слу 
чаях применения {-критерия, будет показано ниже. 

Оценка разности средних. Сравнивая друг с дру- 
гом две независимые выборки, взятые из нормально распреде 
ляющихся совокупностей с параметрами | и џг, можно пред 
положить, что ш-—иг= О, а дисперсия этой разности о?р. Зна- 
чения генеральных параметров неизвестны, однако несложнс 
найти величины выборочных средних и разность между ним; 
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(х1—22) =а4. Нулевая гипотеза сводится к предположению, что 
ш = р. Критерием для проверки Но-гипотезы служит отно- 
щение 


#— (х1 — х2)-- бы +в), 
$ 
1-х 
где { — переменная величина, следующая {-распределению 
Стьюдента с числом степеней свободы ё= (1—1) + (п:—1) = 
=, 72—92, а 5х,_;; — ошибка указанной разности, обознача- 
емая в дальнейшем символом 54. 

Так как, согласно Но-гипотезе, ш — = 0, то {критерий вы- 
ражается в виде отношения разности выборочных средних к 
своей ошибке, т. е 

РЕ бо? ИК ВВ 


5а 54 ў 

Но-гипотезу отвергают, если фактически установленная ве- 
личина #-критерия (обозначаемая символом +) превзойдет или 
окажется равной критическому (стандартному) значению #5 
этой величины для принятого уровня значимости а и числа сте- 
пеней свободы &= 1 +п2—2, т. е. при условии №25. 

Ошибку разности средних ѕа определяют по следующим 
формулам: 
а) для равночисленных выборок, т. е. при т = п, 


тузт ааа ага 
= 35. +87, Б п(п— 1) а п(п — 1) 
Хб а) Уа)? . (73) 
(п — 1) п 


б) для неравночисленных выборок, т. е. при №1521, 
= а Е и аза )= 
А пі + по — 2 п1п2 


Е и Зай а? (тім) | (74) 


пу + по — 2 119 


п п 1 
= можно использовать (-- + 


В этой формуле вместо ( га 
1 


фе 
па 
Пример 1. Изучали влияние кобальта на массу тела кроли- 


ков. Опыт проводнли на двух группах животных: опытной и 
контрольной. Были исследованы кролики в возрасте от полу- 
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п1п2 


тора до двух месяцев, массой тела 500—600 г. Опыт продол 
жался полтора месяца. Животных обеих групп содержали н: 
одном и том же кормовом рационе. Однако опытные кроликЕ 
в отличие от контрольных ежедневно получали добавку к раци- 
ону в виде водного раствора по 0,06 г хлористого кобальта НЕ 
1 кг живой массы тела. За время опыта животные дали сле 
дующие прибавки живой массы тела (табл. 35). 


Таблица 3: 
Привесы, г Отот, ре Квадраты отклонений 
опыт контроль опыт контроль опыт контроль 
580 504 58 22 3364 484 
692 560 54 34 2916 1156 
700 420 62 106 3844 - 11 236 
621 600 17 74 289 5 476 
640 580 2 54 4 2916 
561 530 77 4 5929 16 
680 490 42 36 1764 1 296 
630 580 8 54 64 2916 
470 56 3136 
У == 5104 = 4734 — — Х==18 174 | У==28 632 
21==638 20=526 — — 7-46 806 


Средние арифметические привесов: в опыте #; ==5104/8= 
=638 г, в контроле х= 4734/9 = 526 г. Разница |51—22| =а= 
= 112 г. Чтобы установить, достоверна или случайна эта ра-- 
ница, нужно определить ошибку разности средних по форму- 
ле (74): 


«= 46-806 9+8 1/75 8.07,14, 


847 9.8. 


Отсюда іф= 112/27,13=4,1. По табл. У Приложений для 1%-нс 
го уровня значимости и числа степеней свободы &=9+8—2= 1? 
находим #;:=2,95. Так как > нулевая гипотеза опровергё 
ется на высоком уровне значимости (Р< 0,01). Разница между 
средними величинами опыта и контроля оказалась в высшеѓ 
степени достоверной. 

Пример 2. На двух группах лабораторных мышей — опыт 
ной (71=9) и контрольной (по = 11) — изучали воздействие н: 
организм нового препарата. После месячных испытаний массе 
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тела животных, выраженная в граммах, варьировала следую- 
щим образом: 


В опытной группе 80, 76, 75, 64, 70, 68, 72, 79, 83 Ў = 74,1 
В контрольной группе 70, 78, 60, 80, 62, 68, 73, 60, 71, 66, 69 Х2== 68,8 


Разница между средними |2,—22|=5,3 г. Для определения 
ошибки этой разности предварительно рассчитаем девиаты: 
Ру = ХУ(х: — 8)? = Ух? — (Ух)2/п = (802 + 762 + ... + 83?) — 
—6672/9=302,89 и О,== (7024-78-60? ... +692) —7572/11 = 
==443,64. Отсюда ошибка разности средних выразится величиной 
2 _ 302,80 + 443,64 9+ \ _ 14930,6 _ ИЯ 88 — 
Ст: | 9-12 17850 — 8:88 и 8 Ува 


=2,89. Критерий +=5,30/2,89 = 1,83. Для Е=9-11-—2=18 и 
5%-ного уровня значимости в табл. У Приложений находим 
1,:=2,10. Так как №<Ё;ь нулевая гипотеза остается в силе. 

Неопровержение Но-гипотезы нельзя рассматривать как до- 
казательство равенства между неизвестными параметрами сово- 
купностей, из которых извлечены сравниваемые выборки. 
В таких случаях вопрос о преимуществе одной статистической 
совокупности перед другой остается открытым. Ведь не исклю- 
чеио, что при повторных испытаниях Но-гипотеза может ока- 
заться несостоятельной. Более того, и в тех случаях, когда 
Но-гипотеза опровергается, не следует спешить с окончатель- 
ным выводом. 

Следует заметить, что вышеизложенное применение {-крите- 
рия предполагает, что дисперсии сравниваемых групп одинако- 
вы: о? = 0°. Если это не так, то величину критерия находят 
по формуле 


1-5] 
Ит + 55/15 и 
а число степеней свободы — по следующим формулам: 
2п — 2 
82/92 +. 8252 7 


52 ее 82/п. \2 ТРАТ 
б) при п! ж л 122) || (1/1) дь (=2/лз)? |, 


п1 пд п +1 п + 1 
(76) 


Так, при изучении влияния кобальта на массу тела кроли- 


- - -18 174 —2596,3 


28 632 =3579,0 (см. табл. 35). Видно, что 52>52. 


== 


а) при И: =И. Ё==п —– 14- (75) 


ков (см. пример 1) дисперсии равны $== 


1 
9—1 


2 — 
и 52 = 
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Следовательно, величину критерия необходимо определять с уче- 
том неравенства дисперсий. Предварительно найдем 57/1. == 
=2596,3/8 = 324,54 и 52/п›=3579,0/9=397,67. Величина {-крите- 
рия равна #,-==638 — 526// 324,54 397,67 =4,17. Затем опре: 
деляем (5?,/п,)?/(п, +1) =324,542/9 = 11702,6 и (525/пз)?/(пз-+1) = 
= 397,672/10 =15813,9. В результате Ё=722,22/27516,6—2=17. 
Для Ё=17 и а=1% в табл. У Приложений находим {,; = 2,90. 
Так как №=4,17>1::=2,90, то Но-гипотеза отвергается. 

Правильное применение #критерия предполагает нормаль- 
ное распределение совокупностей, из которых извлечены срав- 
ниваемые выборки, и равенство генеральных дисперсий. Если 
эти условия не выполняются, то {-критерий применять не сле- 
дует. В таких случаях более эффективными будут непарамет- 
рические критерии. 

Оценка средней разности между выборками с 
попарно связанными вариантами. Сравниваемые 
выборки нередко представляют собой ряды попарно связанных 
вариант, т. е. являются зависимыми выборками. В таких слу- 
чаях оценкой разности между генеральными средствами м — 
—з=) будет средняя разность, определяемая из суммы раз- 
ностей между попарно связанными вариантами сравниваемых 
групп, т. е. 


п 


Оценкой генеральной дисперсии о? разности средних у —иг== 
= будет выборочная дисперсия 
2204-0) 
п — 1 


(78) 


В формулах (77) и (78) п— число парных наблюдений; @;== 
= х;—} величина 4 идентична разности средних, т. е. 
й = 


2 =(х; — х3). 
п 


Ошибку средней разности 4, обозначаемую символом 54, 
определяют по формулам 


2 НР 
аА ха _ ХЎ2- (79) 
2 п(п — 1) Е 
ИЛИ 
у ЗН, (2 -2). (80) 
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Если члены генеральной совокупности распределяются нор- 
мально, то и разности между ними будут распределяться нор- 
мально и случайная величина {= (4—0)/54 будет иметь распре- 
деление Стьюдента с Ё=и—| степенями свободы. Но-гипотеза 
сводится к предположению, что и—изг=Др=0. Отсюда {-крите- 
рий выразится в виде отношения средней разности к своей 
ошибке, т. е. {=4/52. Если +2: для принятого уровня зна- 
чимости и числа степеней свободы А=п-—1, то нулевая гипоте- 
за должна быть отвергнута. 

Пример 3. На протяжении ряда лет в условиях Одесской 
опытной станции изучали влияние черного и апрельского пара 
на урожай ржи. Результаты опыта учитывали по массе 
1000 зерен (табл. 36). 


Таблица 36 
Масса 1000 зерен по годам опыта 
на 1898 1899 | 1901 1902 1903 1904 Среза 
Апрельскому 81,6 |24,2, | 24,8 | 291 | 299 | 31,0 28,43 
Черному 31,1 | 24,0 | 24,6 | 28,6 | 29,1 | 30,1 27,91 
Разность 4 0,5 | 0,2 0,2 0,5 0,8 0,9 4==0,52 
Квадрат разностн 4;2 0,25 | 0,04 | 0,04| 0,25] 0,64] 0,81 ха =2, 03 


В табл. 36 приведены выборки с попарно связанными вари- 
антами: несомненно, что каждый год имел свои специфические 
условия, которые одинаково влияли на урожай ржи, посеян- 
ной как по черному, так и по апрельскому пару. Поэтому обра- 
батывать полученные данные нужно с учетом тех условий, в 
которых проводили эксперимент. Из табл. 36 видно, что уро- 
жай ржи по апрельскому пару несколько выше, чем по черно- 
му. Средняя разность 4==У4/п==3,1/6 = 98 г. Определяем 
ошибку этой разности: 


ау 298 ох 2080527]. и ие 0,010,127. 


0.52 433. Для #=6—1=5 и а=19% #:=4,03 


Критерий #,= ГЕТ 
(см. табл. У Приложений). Так как %>Ьь то Но-гипотезу 
отвергают на высоком уровне значимости (0,001<Р<0,01). 
Следовательно, с вероятностью Р>>0,99 можно утверждать, что 
разница между сравниваемыми выборками статистически дос- 
товерна. 

Пример 4. В результате семилетних исследований урожай- 
ности ячменя и овса в условиях нечерноземной зоны РСФСР 
были получены следующие данные (табл. 37). 
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Таблица 37 


Урожай, ц/га 


Разница 4 а,—а (а.—а)' 


Годы і 
ячменя 

1928 7,7 8,26 —0,56 —1,54 2,37 

1929 9,0 7,22 1,78 0,80 0,64 

1930 9,4 8,43 0,97 —0,01 0,00 

1931 7,4 5,57 1,83 0,85 0,72 

1932 7,4 6,35 1,05 0,07 0,00 

1933 10,9 8,00 2,90 1,92 3,69 

1934 8,0 9,13 —1,13 —92,11 4,45 
Сумма 59,8 52,96 6,84 — 11,87 
Среднее 8,54 7,56 0,98 — — 


Разница между средним урожаем ячменя и овса составила 


8,54—7,56==0,98 ц/га. Ошибка этой разницы == Ч 
==У 0,283==0,53. Отсюда №==0,98/0,53=1,85. Эта величина не 
превышает критический уровень #;:=2,45 для 5%-ного уровня 
значимости и числа степеней свободы &= (7—1) =6. Следова- 
тельно, нулевую гипотезу здесь отбросить нельзя. 

Оценку средней разности можно произвести по доверитель- 
ному интервалу, построенному на основании полученной разно- 
сти 4 и ее ошибки 52. Если нижняя граница доверительного 
интервала окажется с положительным знаком, это будет сви- 
детельствовать о достоверности разницы. Если же нижняя гра- 
ница доверительного интервала будет с отрицательным зна- 
ком, это будет служить указанием на случайный характер 
наблюдаемой средней разности. 

Так, в примере 3 24-152 =0,52-=1,96.0,12=0,52-=0,24. Нижняя 
граница 95%-ного доверительного интервала (0,52—0,24-=0,28) 
оказалась с положительным знаком, тогда как в примере 4 
а-Е154== 0,98 1,96.0,53 == 0,98 1,04 и нижняя граница довери- 
тельного интервала (0,98—1,04=—0,06) оказалась с отрица- 
тельным знаком, что не дает основания для отклонения нуле- 
вой гипотезы. 

Оценка разности между долями. Выборочная 
доля зависит от Числа единиц в выборке, имеющих учитывае- 
мый признак, а общее число таких единиц в генеральной сово- 
купности определяет генеральную долю Р. Оценкой разности 
между генеральными долями Р;—Р;= 0 служит разность меж- 
ду выборочными долями р: —рг==4. Отношение этой разности 
к своей ошибке дает случайную величину 2=Ч [54 которая 


зоп 


следует {-распределению Стьюдента. Но-гипотезу, или предпо- 
ложение о том, что Р, = Р, отвергают, если №2 для Ё= + 
+ло—2 и принятого уровня значимости а. Ошибка разности 
между долями, взятыми из приблизительно равиовеликих выбо- 
рок (когда численности групп различаются не более чем на 
25%), вычисляют по формуле 


а с Гаете 
р (1 Рі) | 2201 — рә) Р1б1 Р242 
84 == А = 6 р 81 
ар ү п + п) и п + пз , ( ) 
где 9=1—р. Если доли выражены в процентах от общего чис- 
ла наблюдений, ошибку разности между ними определяют по 
формуле 


р. (100 100 — 
„= р1( Р1) + рг( рг) (82) 


Пп] п) В 
Сопоставляемые группы п! и п» могут быть выражены абсо- 
лютными числами т; и т.о. Ошибка наблюдаемой между ними 
разности определяется по следующей формуле: 


„у = т!) ЕТА табаар (83) 
но так как т/і = рі; тә[по= ро; (п1-——та1)/т = 91; (пота) /[по== 
= 9), то формулу (81) можно представить и в таком виде: 


5, = У пур р) пора р) = т, троа 
Когда сравнивают доли из неравновеликих выборок и при 


75% <р<25%, ошибку разности между ними определяют по 
формуле 


5, „-И ва- В н.) (2-2); (84) 


р определяют как средневзвешенную из рі и рз долей, или же 
из абсолютных численностей групп: 
Ріт + р2пә ___ т | тә 
р = —————————-==————————, (85) 
т + пә т + п 
В этих формулах и; и пз — численности групп, на которых 
определяют доли ру = т; и рг= т2/п.. Если доли выражают 
в процентах от и, то вместо д=1—р нужно брать 9 = 100—р. 
Если же неравновеликие группы выражены абсолютными чис- 
лами т; и то, ошибку разности между ними определяют по 


формуле 
р те о Кт пі + п (86) 
п 1 №2 пі +72 п1й2 
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Пример 5. В потомстве от скрещивания двух золотисты: 
хомячков с самками-альбиносами того же вида было полученс 
в первой группе — 14 золотистых и 9 особей-альбиносов, а вс 
второй группе — 12 золотистых и 8 особей-альбиносов. Разни 
ца между полученными в потомстве золотистыми особями сс 
ставила 14—12==2 единицы. Определяем ошибку этой разнице 


| 14.9 › 12.8 уи 
22, 28 —3.9. 
ар и 23 20 / 10,283, 


Критерий і = 2/3,2-0,62 (эта величина не превосходит точ- 
ку :=2,02 для &=23+-20—2=41 и 5%-ного уровня значим‹. 
сти; см. табл. У Приложений). Отсюда ясен вывод: Но-гипс. 
тезу отвергнуть нельзя; разница между численностью золотиг 
тых хомячков, полученных в потомстве разных производителей, 
оказалась статистически недостоверной. 

Пример 6. Изучали влияние эндотоксина на выживаемост: 
облученных животных. Результаты опыта приведены в табл. 3с 


Таблица 3: 
Группы жнвотных | Выжило | Погибло Всего 
Контрольная 3 (21,4%) 11 (78,6%) 14 
Опытная 23 (63,9%) 13 (36,1%) 36 
Всего | 26 | 24 | 50 


Доля выживших в контроле р! =3/14=0,214; в опыте рэ= 
= 23/36=0,639. Разница 4›=0,639—0,214==0,425. Нужно найт: 
ошибку этой разницы. В данном случае объемы выборок (п! = 
=14 и п›=36), из которых взяты для сравнения доли живот 
ных, различаются более чем на 25%. Определяем взвешеннук 


0,2:4.14 0,639.36 3+23 
олю: =_= 2; == | — = с 
д р ТЕТ Т 0,52; д=1—0,52 =0,4% 


Подставляем найденные величины р и 9 в формулу (84): 
„у 0,52-0,48 [1—5 )-=И0,025—0,157. 


Критерий #=0,425/0,157= 2,71 превосходит критическую тоз- 
кү 11= 2,70 для 6=50—2=48 и 1%-ного уровня значимости 
улевая гипотеза опровергается на высоком уровне значимості 
(Р<0,01). Следовательно, с вероятностью более 99% можнс 
судить о положительном действии эндотоксина на выживає 
мость подопытных животных. 
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Описанные выше критерии проверки равенства долей в двух 
выборках оказываются пригодными при не слишком больших 
и не слишком малых значениях р (25% <р<75%). Особенно 
это относится к случаю небольших выборок. Свободным от 
подобного рода ограничений и поэтому более универсальным 
оказывается способ проверки равенства долей, основанный на 
использовании угловой трансформации (ф-преобразования Фи- 
шера). При этом методе сравниваемые доли выражают в про- 
центах с введением поправки Йейтса на непрерывность, равной 
п, которую вычитают из большей и прибавляют к меньшей 


доле. Затем по таблице значений Ф—2 агсзтИ р (см. табл. 
УШ Приложений) находят величины для исправленных долей: 
р1% +100/(21) и р2%—100/(2п), берут нх разность и относят 
ее к ошибке, определяемой по формуле 


= +. (87) 


Условием для непринятия нулевой гипотезы служит следующее 
выражение: 


ЕРЕЕН Зак ВЕН ИАА а 
и УГ (Ф ыр ер 21 
для =п+12—2 и принятого уровня значимости. 

Так, относительно оценки влияния эндотоксина на выживае- 
мость облученных животных (см. табл. 38) имеем: контроль 
(р1%) 21,4 100/(2.14) = 24,97%; опыт (р2%) 63,9—100/ (2.36) = 
=62,51%. По табл. УП Приложений для р, =24,97 находим 
фі = 1,047 и для р2=62,51 ф.= 1,824. Отсюда критерий достовер- 
ности 


= 1,824 — 1,047 22 0,777 559 47. 


И гу: 9305 
14 36 
Эта величина превосходит критическую точку Ё:=1,96 для 
к =14--36—2=48 и а=59 (см. табл. У Приложений). Нулевая 
гипотеза опровергается на уровне значимости (0,01<Р< 0,05). 
Оценка разности между выборочной и гене- 
ральной долями. При оцеике разности между известной 
генеральной долей Р и долей выборки р нулевая гипотеза сво- 
дится к предположению, что разница между ними возникла 
случайно. Критерий Стьюдента в таких случаях выражается в 
виде отношения разности (Р——р)=а» к своей ошибке, которую 
определяют по формуле 


] РЕ 
5 = Р-Р, (88) 
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где п— объем выборки. Как и в предыдущих случаях, усло: 
вием для непринятия нулевой гипотезы служит критерий 


== 2-2 21: для = п--1 и принятого уровня значимо- 
р 
сти (о). 


Пример 7. Изучали влияние возраста производителей на 
пол потомства у крупного рогатого скота. Для спаривания с 
разновозрастными быками подбирали коров одинакового воз- 
раста. Результаты испытаний приведены в табл. 39. 


Таблица 39 
Родилось телят Ошибка 
Возраст Доля — разности Критерий 
ў Р — 

а 8 гарб нз вих телок р р 54 р Ф 
2—3 141 77 0,55 0,05 0,043 1,16 
4—5 89 43 0,48 0,02 0,053 0,38 
6—7 88 41 0,46 0,04 0,053 0,75 

>7 118 49 0,42 0,08 0,046 1,74 


Доля телок в генеральной совокупности принята равной 
Р=0,50. Ошибку разности между генеральной и выбопочной 


0,5-0,5 _ 
141. 


=—]/0,0018-0,043 ит. д. В табл. 39 приведены значения 


1ф-критерия Стьюдента для каждой группы. Поскольку все они 
не превосходят критическую точку ѓ;:=2,0 для 5%-ного уровня 
значимости (см. табл. У Приложений), нулевая гипотеза оста- 
ется в силе. Вопрос о влиянии возраста производителей на пол 
потомства в данном исследовании остался открытым. 

Е-критерий Фишера (Ё-распределение). Для проверки 
Но-гипотезы о равенстве генеральных дисперсий (021 = 0?) нор- 
мально распределяющихся генеральных совокупностей {-крите- 
рий оказывается недостаточно точным, особенно при оценке 
разности дисперсий малочисленных выборок. В поисках лучше- 
го критерия Р. Фишер нашел, что вместо выборочной разности 
51—52 удобнее использовать разность между натуральными ло- 
гарифмами этих величин, т. е. іп 51—11 52, где 512252. Эта раз- 
ность, обозначенная Фишером буквой 2, распределяется нор- 
мально при наличии как больших, так и средних по объему 
статистических совокупностей. 

При определении величины = можно вместо иатуральных 
использовать десятичные логарифмы, так как 2=2,3026 (10 51— 
—1 52) или 2=2,3026 10 (51/51), а также г=1,1513 16 (521/52), 
где 521>52.. Д. Снедекор предложил вместо логарифма отноше- 
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долями определяли по формуле (88): 5, = 
р 


ний использовать отношения выборочных дисперсий, обозначив 
этот показатель в честь Фишера буквой Ё, т. е. 


Е=51/52 при 5% 5. 82, (89) 


Так как принято брать отношение большей дисперсии к 
меньшей, то критерий 21. Если 52, =52,, то Ё=1. Чем значи- 
тельнее неравенство между выборочными дисперсиями, тем 
больше будет и величина Ё, и, наоборот, чем меньше окажется 
разница между дисперсиями, 
тем меньше будет величина Ё. #(Е) 

Величина Ё имеет непре- 
рывную функцию распределе- 
ния и зависит только от чисел 
степеней свободы Ё =п;—1 и • 
Ез=пә—1. Е полностью опре- 
деляется выборочными дис- 
персиями и не зависит от ге- 
неральных параметров, так Б, Е, Е 
как предполагают; что. срав рае. График плотности вероятио- 


ниваемые выборки, характери- сти Е-распределения для типичиых 
зуемые дисперсиями 51? и 5:2, значений степеии свободы #1 и № и 
взяты из генеральных сово- критические граиицы Ру и Рз (по 
купностей с 012==0:2 или из Н. В, Смирнову аа 
одной и той же генеральной 2 

совокупности. Функция рас- 

пределения возможных значений величины Ё при небольшом п 
имеет форму асимметричной кривой, которая по мере увеличе- 
ния числа испытаний (л-ғ+оо) приближается к кривой нормаль- 
ного распределения (рис. 21). 

Функция Р-распределения табулирована для 5%-ного (Р= 
= 0,05) и 1%-ного (Р=0,01) уровней значимости и чисел сте- 
пеней свободы А, для большей дисперсии и Ё: для меньшей. 
Критические точки для Р-критерия содержатся в табл. УГ При- 
ложений. В этой таблице степени свободы для большей дис- 
персии А; расположены в верхней строке (по горизонтали), а 
степени свободы для меньшей дисперсии Ёз — в первой графе 
(по вертикали). Если сравниваемые выборки извлечены из 
одной и той же генеральной совокупности или из разных сово- 
купностей с дисперсиями 02; и 02, равными друг другу: 071 = 03, 
то величина Ё-критерия не превысит критические точки (Ё,:), 
указанные в табл. УІ Приложений для Ё и Ё, и принятого 
уровня значимости о. Если же выборки взяты из разных сово- 
купностей с их параметрами о? и оо, не равными друг другу, 
то Ёф22Ё,. и нулевая гипотеза должна быть отвергнута. 

Пример 8. В табл. 35 содержатся данные о влиянии кобаль- 
та на массу тела кроликов. Рассчитанные для этих данных 
дисперсии таковы: в опытной группе 52,==2596,3, в контроле 
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52, =3579,0. Дисперсионное отношение Р=3579,0/2596,3 = 1,3. 
В табл. УІ Приложений для 59%-ного уровня значнмости 
(Р=0,05) и чисел степеней свободы Ё,=9—1=8 (см. верхнюю 
строку таблицы) и Ё2=8—1=7 (см. первую графу той же таб- 
лицы) находим Ё;:= 3,5. Так как Ёф<Ё;, нулевая гипотеза 
остается в силе (Р2 0,05). Это означает, что генеральные пара- 
метры сравниваемых групп 02,=0? и что применение /-крите- 
рия для проверки Но-гипотезы в отношении оценки разности 
между выборочными средними 2; и Ў; имеет достаточные осно- 
вания. 

Е-критерий можно применить и для оценки разности между 
долями из иеравновеликих выборок. Нулевая гипотеза отвер- 
гается при условии, что 


Р-Р для | 


у= 1; 
== |-и — 2. 


При этом А! находят по горизонтали, а & — в первом столб- 
це табл. УІ Приложений. Так, обращаясь к примеру 6 о влия- 
нии эндотоксина на выживаемость подопытных животных (см. 
табл. 38), имеем Фф: = 1,047 и фз = 1,824. Значения ф и Ф; най- 
дены по табл. УШ Приложений. Учитывая, что л =14 и п= 36, 
находим Р = (1,824—1,047)214-36/(14-+-36) = 0,604 (504/50) =6,09. 
Для А; = 1, №2=48 и 5%-ного уровня значимости критическая 
точка Ё,:.=4,0 (см. табл. УІ Приложений). Но-гипотеза опро- 
вергается на 5%-ном уровне значимости (Р<0,05). Таким об- 
разом подтверждается ранее сделанный вывод о положитель- 
ном влиянии эндотоксина на выживаемость подопытных жи- 
вотных. 

Если оценивают разность между средними &#; и Х› выборок, 
извлеченных из совокупностей, которые распределяются по за- 
кону Пуассона, Ё-критерий строят в виде отношения 


В =— > РЕ, для и =? (=, 1); 
х + 1 Ео==2х1 
и принятого уровня значимости (о). 

Оценка разности между коэффициентами вариации, Раз- 
ность между коэффициентами вариации сравниваемых групп, 
извлеченных из нормально распределяющихся совокупностей, 
можно оценить с помощью ї-критерия Стьюдента. Приближен- 
ной оценкой разности Со!—Со=@4с, служит ее отношение к 
своей ошибке, которая равна корню квадратиому из суммы 
ошибок коэффициентов вариации сравниваемых групп, т. е. 


5а И 56», 88,4 (90) 


Нулевую гипотезу отвергают, если №>1: для принятого уровня 
значимости и числа степеней свободы &=л!-+П2—2, 
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Пример 9. Выше было найдено (см. табл. 35), что опытная 
(п1=8) и контрольная (п›=9) группы кроликов характеризу- 
ются средними 2,=638 и %:=526 г. Соответственно 
$1 = 2596,3 ==50,95 и 5.=У 3597,0=59,97. Отсюда Со; = 
= 100(50,95/638) =8,0% и Сог=100(59,97/526) =11,4%. Разннца 
йсь=11,4—8,0= 3,4%. Определяем ошибки этих показателей по 
формуле (65): 


с 91 0,5002, 0,54 +») |= —У9,143.0,506=У/ 4.68 —2,15; 


ТИ ны [6,5 +( и) = —=И16,245.0.518—5,04—2,54. 


Ошибка разности ѕа.,=/ 2,15--2,24 == 4,39=2,10. Крите- 


рий =3,40/2,10= 1,62. Эта величина не превосходит критнче- 
скую точку &:=2,13 для &=8+9—2=15 и “=5%, что не дает 
основания для отвергания нулевой гипотезы. 

Разность между коэффициентами варнации можно оценить 
путем сопоставления доверительных интервалов, построенных 
для генеральных параметров сравниваемых групп. При этом 
границы доверительных интервалов определяют по формулам 


Со А 

а 1+КУ 1+269 ' СА 
Со 

РКТ, РУ 


где Ри — нижняя, а Р, — верхняя границы доверительного ин- 


[А 
тервала; К == —————— ;#— нормированное отклонение (для 


2 (п — 1) 
= 59% #= 1,96). 
Определим границы доверительного интервала для опытной 
оо е выразив коэффициент вариации в долях единицы, т. е. 
0 = (0) 


1,96 0,08 0,08 
= | ==\, 2; =_= ‚053, 
к у 2-7 Е. 140,52 УГ +2.-0,082 1,52 0 
или 5,3%; уе в =, 167, или 


16,7 %. 


Аналогично определяем границы доверительного интервала 
для контрольной группы: 


1,96 0,114 ЕЕ ГИР 
а У2:8 ОЕ тоу 012 1,496 
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=0,076, ИЛИ 7,6 %; Р еа =0,226, 


или 22,69%. 

Итак, в первом случае границы доверительного интервала 
оказались от 5,3 до 16,79%, во втором — от 7,6 до 22,6%. Таким 
образом, границы доверительного интервала, построенного для 
контрольной группы, близки к границам интервала опытной 
группы кроликов, что указывает на отсутствие существенных 
различий между коэффициентами вариации этих групп. 


У.3, НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 


Правильное применение параметрических критериев для про- 
верки статистических гипотез основано на предположении о 
нормальном распределении совокупностей, из которых взяты 
сравниваемые выборки. Однако это не всегда имеет место, так 
как не все биологические признаки распределяются нормаль- 
но. Немаловажным является и то обстоятельство, что исследо- 
вателю приходится иметь дело не только с количественными, 
но и с качественными признаками, многие из которых выра- 
жаются порядковыми номерами, индексами и другими услов- 
ными знаками. В таких случаях необходимо использовать 
непараметрические критерии. 

Известен целый ряд непараметрических критериев, среди 
которых видное место занимают так называемые ранговые кри- 
терий, применение которых основано на ранжировании членов 
сравниваемых групп. При этом сравниваются не сами по себе 
члены ранжированных рядов, а их порядковые номера, или ран- 
ги. Ниже рассмотрены некоторые непараметрические критерин, 
применяемые для проверки нулевой гипотезы при сравнении 
как независимых, так и зависимых выборочных групп. 

Х-критерий Ван-дер-Вардена. Этот критерий относится к 
группе ранговых критериев, его применяют для проверки нуле- 
вой гипотезы при сравнении друг с другом независимых выбо- 
рок. Техника расчетов Х-критерия сводится к следующему. 
Сравниваемые выборки ранжируют в один общий ряд по воз- 
растающим значениям признака. Затем каждому члену ряда 
присваивают порядковый номер, отмечающий его место в об- 
щем ранжированном строю. Далее по порядковым номерам 
одной из выборок, обычно меньшей по объему, находят отно- 
шение К/(М-+1), где №+1 =, +л:4+1, т. е. сумма всех членов 
сравниваемых групп, увеличенная на единицу, а А — порядко- 
вый номер членов ряда, их «ранг». 

С помощью специальной таблицы (см. табл. ІХ Приложе- 
ний) находят значения функции А/(М№+1)] для каждого зна- 
чения К/(№+1). Суммируя результаты (обязательно с учетом 
знаков!), получают величину Хъ==Уф[Ю/(М№--1)], которую срав- 
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ивают с критической точкой этого критерия Х,: для принято- 
‘о уровня значимости с и общего числа членов сравниваемых 
зыборок, т. е. №= 1+ пә. Критические точки Х-критерия для 
:%-ного и 1%-ного уровней значимости и общего числа членов 
івух выборок М=п;+л, (с учетом разности 1 —й:) содержат- 
‚я в табл. Х Приложений, 

Нулевая гипотеза сводится к предположению, что сравни- 
заемые выборки извлечены из генеральных совокупиостей с 
динаковыми функциями распределения. Если окажется, что 
‘фо> Хь, нулевая гипотеза должна быть отвергнута на принятом 
'ровне значимости. 

Пример 10. Вернемся к результатам опыта по проверке дей- 
твия нового препарата на массу тела лабораторных мышей 
см. пример 2), где сравнивали две группы — опытную (п, :=9) 
г контрольную (й5== 11) — с попарно не связанными числовыми 
:иачениями признака. Примеиим Х-критерий Ван-дер-Вардена 
: оценке результатов этого эксперимента. Расчет Х-критерия 
то ранжированным значениям признака сравниваемых групп 
триведен в табл. 40. 


Таблица 40 
Масса тела мышей, г 
Порядко- Р ( А ) 
вый ном 
опыт контроль А ыы +1 +1 
60 1 
60 2 
62 З 
64 4 4/21 = 0,190 —0,88 
66 5 
68 6 6/21 = 0,286 —0,57 
68 7 
69 8 
70 9 9/21 =0,429 —0,18 
70 10 
71 11 
72 12 12/21 =0,571 --0,18 
73 13 
75 14 14/21 =0,667 0,43 
76 15 15/21 ==0,714 +0,57 
78 16 
79 17 17/21 =0,810 --0,88 
80 18 
80 19 19/21 =0,905 41,31 
83 20 20/21 =0,952 41,66 
п =9 по==11 == еж --3,40 


_ В данном случае М=и! +п2=9+11=20. Для этого числа 
№М==20) и 5%-ного уровня значимости с учетом разности /!— 
—п›=11-9=2 в табл. Х Приложений находим Х,:=3,84. Так 
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как Хф=3,40<Х,;=3,84, нулевую гипотезу не учитывать нель- 
зя; разница между контролем и опытом оказывается статисть 
чески недостоверной. 

Пример 11. Проанализируем с помощью Х-критерия Вар 
дер-Вардена результаты опыта о влиянии кобальта на величь 
ну массы тела кроликов (см. табл. 35). Расчет величины Х= 
==>4[Ю/(М№М--1)] приведен в табл. 41. 


Таблица 4 
Масса тела кроликов, г 
Порядковый Ю т Р ) 
номер 
контроль опыт К М+1 +1 


420 1 
470 2 
490 З 
504 4 
530 5 
560 6 

561 7 7/18 =0,389 —0,28 
580 8 

580 9 9/18 =0,500 0,00 
580 10 
600 11 

621 12 12/18 == 0,667 0,43 

630 13 13/18 ==0,722 0,59 

640 14 14/18 == 0,778 40,77 

680 15 15/18 = 0,833 +0,97 

692 16 16/18 ==0,889 41,22 

700 17 17/18 ==0,944 +1,59 

п! =9 й2== 8 = — 45,29 


Найденная величина критерия Х.=Уф[Ю/(№М--1)] =5,29 пре- 
восходит критическую точку Х,:=4,44 для 19%-ного урови, 
значимости и №=9-+8= 17 с учетом разности мі —лп,=1 (с. 
табл. Х Приложений), что дает основание отвергнуть нулевук 
гипотезу на высоком уровне значимости (Р<0,01) и заключить, 
что влияние кобальта на величину массы тела кроликов дос 
товерно. 

О-критерий Уилкоксона (Манна—Уитни). Гипотезу о пре 
надлежности сравниваемых независимых выборок к одной + 
той же генеральной совокупности или к совокупностям с одинг 
ковыми параметрами, т. е. Но-гипотезу, можно проверить с п. 
мощью рангового критерия Уилкоксона (Манна—Уитни). 

Для расчета И-критерия необходимо: 1. Расположить чи 
ловые значения сравниваемых выборок в возрастающем пе 
рядке в один общий ряд и пронумеровать члены общего ряд: 
от | до М=п:-+п2. (Эти иомера и будут «рангами» членов ря- 


130 


да.) 2. Отдельно для каждой выборки найти суммы рангов Ю 
и определить величины 


7, ==, и, (93) 
И 
Ию, — О, (94) 


которые отображают связь между суммами рангов первой и 
второй выборки. 3. В качестве И-критерия использовать мень- 
шую величину (/ф, которую сравнить с табличным значением 
О... Условием для сохранения принятой Но-гипотезы служит 
неравенство (/ф2> С; Критические точки И-критерия Оз+ для 
п, п и принимаемого уровня значимости © содержатся в 
табл. ХІ Приложений. 

Пример 12. В примере 2 было показано, что разность в мас- 
се тела между опытной (л,=9) и контрольной (п2=11) груп- 
пами лабораторных мышей является статистически недостовер- 
ной. Проверим этот вывод с помощью И-критерия. Для этого 
обратимся к табл. 40, в которой содержатся расположенные в 
возрастающем порядке числовые значения сравниваемых выбо- 
рок и их «ранги». Суммируя «ранги» отдельно для каждой 
группы, находим #;=4+64-9--...+20= 112; К. =1--2+3+...+ 
+18=94. Подставляем эти данные в формулы (93) и (94): 
И: =112—9..10/2=67; И.=94—11.12/2=22. Меньшую величину 
Иъф=22 сравниваем с табличным значением О для п: =9, 
п2=11 и уровня значимости о = 1%, которое равно Из: =19 (см. 
табл. ХІ Приложений). Поскольку Оф2> Ое, отвергнуть прове- 
ряемую Но-гипотезу нельзя. Следовательно, подтверждается 
ранее сделанный вывод о статистической недостоверности раз- 
личий, наблюдаемых между этими выборками. 

Критерий знаков г. В тех случаях, когда результаты на- 
блюдений выражаются не числами, а знаками плюс (+) и 
минус (—), различия между попарно связанными членами 
сравниваемых выборок оценивают с помощью критерия зна- 
ков г. Конструкция этого критерия базируется на весьма прос- 
тых соображениях: если попарно сравниваемые значения двух 
зависимых выборок существенно не отличаются друг от друга, 
то число плюсовых и минусовых разностей окажется совершен- 
но одинаковым; если же заметно преобладают плюсы или мину- 
сы, это будет указывать на положительное или отрицательное 
действие изучаемого фактора на результативный признак. Боль- 
шее число однозначных разностей служит в качестве фактиче- 
ски найденной величины 2-критерия знаков. При этом нулевые 
разности, т. е. случаи, не давшие ни положительного, ни отри- 
цательного результата, обозначаемые цифрой 0, в расчет не 
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принимают и Число парных наблюдений соответственно умень 
шается. 

Как и всякий другой выборочный показатель, 2-критериџ 
знаков является величиной случайной; он служит для провег. 
ки Но-гипотезы, т. е. предположения о том, что совокупност: 
или совокупности, из которых взяты сравниваемые выборки 
имеют одну и ту же или одинаковые функции распределения 
Но-гипотеза отвергается, если 2.2г.: для принятого уровня зна 
чимости с и числа парных наблюдений п, взятых без нулевы: 
разностей. Критические точки 2.: для двух уровней значимості. 
и числа париых наблюдений содержатся в табл. ХИ Прилс 
жений. 

Пример 18. Изучали влияние туберкулина иа состав перк 
ферической крови низших обезьян. Результаты наблюдение 
приведены в табл. 42. 


Таблица 4. 
Эозинофилия в крови 

Номера р. о Эффект 
подопытных до введения после введения воздействия 
животных туберкулина туберкулнна 

І + + + + 0 

2 +++ + + + 

3 + + + + 

4 + + + + 

5 +++ + + + 

6 + + ++ + — 

7 + + + + 

8 + + + — 

9 ++ + + + + 

10 + + + + 

П + + + + 0 

12 +++ + + 

13 + + + + 

М + + + + 


Из табл. 42 видно, что после введения туберкулина количе- 
ство эозинофилов в периферической крови у большинстве 
обезьян оказалось пониженным. Так, из 14 наблюдений дв: 
оказались нулевыми, т. е. п=14—2=12. Из этого числа полс 
жительных разностей насчитывается 10. Следовательно, 2ф = 14 
По табл. ХИ Приложений для п=1!2 и а=5% находим 2,;= 10 
Равенство 24=2;, дает основание отвергнуть Но-гипотезу н: 
5%-ном уровне зиачимости. Следовательно, с вероятностьк 
95% можно утверждать, что введение туберкулина (реакция 
Манту) вызывает заметное снижение эозинофилов в перифере 
ческой крови обезьян. 
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Пример 14. В табл. 43 приведены данные о годовых удоях 
оров и их потомства по второму и третьему отелам. 


Таблица 43 
Удой коров, кг ў Разница выражена 

Ранги 

материнского потомства знаками числами РАтНИНИ 
3770 2991 — 779 8 
3817 4593 + 776 7 
2450 3529 + 1076 10 
3463 4274 + 811 9 
3500 3103 — 397 4 
5544 3949 — 1597 12 
3112 3491 Е 379 3 
3150 3559 Ё 409 5 
3118 2916 — 202 1 
3018 4580 + 1562 11 
4291 4510 + 219 2 
3463 4144 и 681 6 


Прибавки в удоях потомства обозначены знаком (--), а 
'дои потомства, оказавшиеся ниже удоев матерей, — знаком 
—). В той же таблице приведены и числовые показатели раз- 
тости между удоями коров материнского поколения и их потом- 
зтва, а также ранги этих различий. Из табл. 43 следует, что из 
2 парных наблюдений положительный эффект обнаружился 
„ 8 случаях, т. е. г.=12—4=8. Эта величина оказалась ниже 
ритической точки 2;:=10 для 5%-ного уровня значимости и 
:==12 (см. табл. ХП Приложений). Следовательно, нулевую 
`ипотезу отвергнуть нельзя. 

Т-критерий Уилкоксона. Когда члены сравниваемых выбо- 
%*ок связаны попарно некоторыми общими условиями (зависи- 
тые выборки), различия между ними с достаточной точностью 
эцениваются с помощью рангового критерия Уилкоксона Т. 
Парный Т-критерий Уилкоксона является более мощным, чем 
:ритерий знаков. Т-критерий рассчитывают следующим обра- 
‘юм. 1. Ранжируют попарные разности, как положительные, 
хак и отрицательные, в один общий ряд. При этом нулевые 
зазности в расчет не принимают, а все остальные независимо от 
‘нака ранжируют так, чтобы наименьшая абсолютная разность 
толучила первый ранг, причем одинаковым по величине разно- 
тям присваивают один и тот же ранг. 2. Находят отдельно 
‘уммы положительных и отрицательных разностей. Меньшую 
з двух сумм разностей, без учета ее знака, используют в ка- 
"естве фактически установленной величины Т-критерия. 3. Срав- 
тивают эту величину Тф с критическим значеннем Т,; для при- 
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нятого уровня значимости с и числа парных наблюдений п, 
которое берут без нулевых разностей. Нулевую гипотезу отвер- 
гают, если 7> Т. Если же Тъ2Т.;, нулевую гипотезу не учи- 
тывать нельзя, Критические значения парного критерия Уилкок- 
сона Г., содержатся в табл. ХПІ Приложений. 

Пример 15. Применим парный критерий Уилкоксона для 
проверки Но-гипотезы относительно данных о годовых удоях 
коров материнского поколения и их потомства, приведенных в 
табл. 43. В последней графе этой таблицы помещены ранги 
абсолютных разностей между парными значениями годового 
удоя коров. Определяем суммы плюсовых и минусовых разно- 
стей: Теру=74-10+9-4-345+11+2+6= 53 и Т) =844+ 12+ 1 == 
==25, Меньшая разность дает Тъ= 25. Сравниваем эту величи- 
ну с критическим значением Т7,;:=15 для п=12 и 0=5% (см. 
табл. ХШ Приложений). Так как Ть> Г», то нулевая гипотеза 
остается в силе. 

Пример 16. В табл. 37 приведены результаты семилетних 
исследований урожайности ячменя и овса в условиях Нечерно- 
земной зоны РСФСР. В той же таблице приведены парные раз- 
ности между урожаями этих культур в разные годы. Статисти- 
ческая оценка результатов опыта привела к выводу о недосто- 
верности средней разности между урожайностью ячменя и овса. 
Проверим этот вывод с помощью непараметрнческого критерия 
Уилкоксона, Выпишем в порядке возрастания разности 4; и их 
ранги А: 


ГА —0,56 +0,97 +1,05 —1,13 -1,78 -+1,83 +-2,90 
К 1 2 3 4 5 6 7 


Меньшую сумму рангов определяют по минусовым разно- 
стям, т. е. Гфр=1-4=5. Эта величина превосходит критическую 
точку {:=3 для п=7 и 5%-ного уровня значимости (см. табл. 
ХПІ Приложений). Таким образом подтверждается ранее сде- 
ланный (с помощью {-критерия Стьюдента) вывод о статисти- 
ческой недостоверности разницы между урожайностью ячменя 
и овса. 


У.4, ОЦЕНКА БИОЛОГИЧЕСКИ АКТИВНЫХ ВЕЩЕСТВ 


При испытании инсектицидов, лекарственных, радиоактив: 
ных и других биологически активных веществ обнаруживает- 
ся, что особи однородной группы реагируют на одну и ту же 
дозу по-разному (индивидуальная изменчивость!) и что разные 
дозы могут вызывать одинаковый эффект у целой группы инди- 
видов. Отсюда следует, что о силе действия на организм био- 
логически активных веществ можно судить лишь по среднему 
результату. 
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Дозы сильнодействующих веществ испытывают на однород- 
ных группах (мыши, крысы и другие объекты) по 6—10 осо- 
бей в группе. На каждой группе изучают одну дозу. Обычно 
применяют 5—9 доз в возрастающем по силе действия по- 
рядке. Опыт проводят одновременно (обычно на протяжении 
одного дня) на всех группах особей. При этом учитывают чис- 
ло особей, у которых обнаружился эффект, и число тех, у ко- 
торых видимого эффекта от действия доз не обнаружено. 
О среднем результате судят по обнаружению эффекта дейст- 
вия доз у 50% подопытных индизидов. 

Определить дозу, вызвавшую видимый эффект или леталь- 
ный исход у 50% подопытных индивидов, можно разными спо- 
собами — графически и аналитически. Установлено, что инди- 
видуальные реакции подопытных животных на воздействие 
биологически активных веществ распределяются, как правило, 
нормально. Зависимость между дозой и эффектом действия 
графически выражается в виде $-образной кривой, или куму- 
ляты (см. рис. 3). Кумулята, называемая кривой эффекта доз, 
может быть получена, если по оси абсцисс откладывают дозы 
вещества, а по оси ординат — эффект воздействия этих доз на 
подопытных животных. Центральная точка кумуляты совпада- 
ет с центром распределения. Опуская из этой точки перпенди- 
куляры на оси координат, можно определить среднюю дозу 
эффекта. Проще, однако, среднюю дозу эффекта определить 
аналитическими способами, один из которых приведен ниже. 

Способ Спирмена — Кербера. Достоинство этого способа за- 
ключается в том, что он позволяет не только рассчитать сред- 
нюю дозу эффекта т, но и построить доверительный интервал 
для генеральной средией и. Среднюю дозу эффекта определя- 
ют по формуле 


где т— минимальная доза, вызывающая эффект у 100% под- 
опытных индивидов; 4 — разница между дозами; Р; — суммар- 
ная доля реагирующих на дозы индивидов. 

Среднее квадратическое отклонение вычисляют по следую- 
щей формуле: 


5а==4ү/2Р,— Р Р, 1712. . (96) 


Здесь Р — сумма ряда накопленных долей реагирующих на 
ДОЗЫ ИНДИВИДОВ. 

Пример 17. На группе, состоящей из десяти лабораторных 
мышей, испытывали действие ядовитого вещества. Дозы яда 
рассчитывали в миллиграммах на 1 кг массы тела подопытных 
животных. Эффект действия яда учитывали по летальным ис- 
ходам. Результаты опыта приведены в табл. 44. 
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В данном случае п==10, 4==10, т==180 мг/кг, Р,=4,0 + 
Р,==11,8. Подставляем известные величины в формулы (95) к 
(96): т=ГО'ьо ==180—10 (4,0—0,5) ==180—35==145 мг/кг; 


—=1012.11,8—4,02—4,0—0,083=10 У 3,517 == 10.1,875== 18,72 
Найденные величины ==145 И $һ= 18,75 позволяют пс 
строить доверительный интервал для генерального параметр. 
т. е. истинной средней дозы эффекта: И-Аш, где Аж= — 
величина предельной ошибки средней т. В данном случае 


$п==иУ п== 18,75/У 10 =18,75/3, 16 =5,93. Отсюда для 5% -ногс 
уровня значимости и соответственно {=1,96 нижняя границе 
доверительного интервала составляет 145—1,96.5,93=145— 


Таблица 4- 
Доза, мг/кг | по | 120 | 130 | мо | 150 | 160 | 120 | тво | СУМ 
Число погибших живот- | 0 1 3 9 | 10 — 
ных 
Доля погибших живот-| 0 0,1 | 0,3 | 0,4 10,6 | 0,7 10,9 10| 40 
ных 
Накопленная доля погиб- | 0 0,1 | 0,4 1,4 [2,1 | 3,0 4,0| 11,8 


щих животных 


—11,62 == 133,38 ~ 133 мг/кг и верхняя граница 145--11,62= 
==156,62 —157 мг/кг. Это означает, что с вероятностью Р= 
=0 95 можно утверждать, что генеральная средняя доза эф 


фекта Г)ьзо находится в пределах от 133 до 157 мг/кг. 


ГЛАВА УІ 
ПРОВЕРКА ГИПОТЕЗ О ЗАКОНАХ РАСПРЕДЕЛЕНИЯ 


У1.1. ПРИМЕНЕНИЕ КОЭФФИЦИЕНТОВ АСИММЕТРИИ 
И ЭКСЦЕССА ДЛЯ ПРОВЕРКИ НОРМАЛЬНОСТИ 
РАСПРЕДЕЛЕНИЯ 


Эмпирический вариационный ряд и его график — вариаць 
онная кривая — не позволяют с полной уверенностью судить ‹ 
законе распределения совокупности, из которой взята выборк:. 
На величине любого варьирующего признака сказывается влия 
ние многочисленных, в том числе и случайных, факторов, ис- 


1 Символ /. уо обозначает дозу вещества, вызывающую летальный исхог 
у 50% подопытных особей. 
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кажающих четкую картину варьирования. Между тем знаиие 
закона распределения позволяет избежать возможных ошибок 
в оценке генеральных параметров по выборочным характери- 
стикам. 

Гипотезу о законе распределения можно проверить разны- 
ми способами, в частности с помощью коэффициентов асим- 
метрии Аѕ и эксцесса Ех. При нормальном распределении эти 
показатели равны нулю. В действительности такое равенство 
почти не наблюдается. Выборочные показатели А$ и Ех, опре- 
деляемые по формулам (48) и (49), являются случайными ве- 
личинами, которые сопровождаются ошибками. В качестве кри- 
терия нормальности распределения служат їл; И {=х, являющие- 
ся отношениями выборочных коэффициентов А5 и Ех к их 
ошибкам репрезентативности, которые определяют обычно по 
следующим приближенным формулам: 


$ дз == ү ; (97) 


1 
24 6 А 
= 20. =/ 5, . (98) 


В связи с тем что выборочные распределения коэффициен- 
тов асимметрии и эксцесса в случае нормальности распреде- 
ления признака при не слишком больших объемах выборок 
(особенно это характерно для Ех) могут быть довольно дале- 
ки от нормального вида, использование квадратических оши- 
бок для Аз и Ех при п, меньшем нескольких сотен наблюде- 
ний, оказывается рискованным. Поэтому более предпочтитель- 
ным следует считать проверку нормальности распределения по 
значениям этих коэффициентов с применением таблиц, приве- 
денных в Приложении (см. табл. ХІУ и ХУ). В них указаны 
критические точки для разных уровней значимости а и объ- 
емов выборки п. Если коэффициенты А и Ех превосходят кри- 
тические точки, содержащиеся в этих таблицах, гипотеза о 
иормальности распределения должна быть отвергнута. 

Так, в примере с изучением формы распределения длины 
хвоинок сосны были получены значения Аѕ==—0,556 и Ех== 
=0,872. Для а=1% и п==200 в табл. ХІУ Приложений нахо- 
дим А5;:==0,403, а в табл. ХУ —Ех.‚=0,832. Так как эмпири- 
чески определенные величины А$ и Ех превышают табличные 
критические значения, можно сделать вывод о наличии у это- 
го распределения значимых асимметрии и эксцесса. 


+ Более точно ошибки коэффициеитов Аз и Ех определиют по формулам 


и 6("— 1) 24" (п — 2) (п — 3) (п — 5) 
бл И ии 3) 2 (п 1)2(п +3) (п 5) ` 
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\1.2. КРИТЕРИЙ ХИ-КВАДРАТ (х?-РАСПРЕДЕЛЕНИЕ) 


Проверку гипотез о законах распределения также произво- 
дят с помощью специально выработанных критериев. Один из 
них, нашедший широкое применение в биометрии, — критерий 
согласия, или соответствия ҳ? (предложен в 1900 г. К. Пирсо- 
ном). Этот критерий представляет собой сумму квадратов от- 
клонений эмпирических частот } от вычисленных или ожидае- 
мых частот , отнесенную к теоретическим частотам, т. е. 


в & 
а: (7—79) 292 


Символ 2 не является квадратом какого-то числа, а выра- 
жает лишь исходную величину, определяемую данной форму- 
лой. Буквой 4 обозначена разность 


Р(Х) между эмпирическими и вычисленными 
05 частотами, 

04 Величина критерия 2 всегда поло- 
03 жительна, так как отклонения эмпири- 
02 ческих частот от ожидаемых или вы- 
11 


численных частот возведены в квад- 
07663100 №620: рат. Поэтому при определении разно- 
сти 4 знаки чисел можно не учиты- 

Рис. 22. Функции ҳ2-рас- Вать, вычитая из больших зиачений 

пределении в зависимости меньшие. При полном совпадении эм- 

от разных чисел степеии пирических частот с вычисленными или 
свободы № ожидаемыми частотами Х (#—}") =0 и 
= 0. 

Распределение вероятных значений случайной величины {2 
является непрерывным и асимметричным (рис. 22), оно зави- 
сит от числа степеней свободы А и приближается к нормаль- 
ной кривой по мере увеличения числа испытаний л. Поэтому 
применение критерия у? к оценке дискретных распределений 
сопряжено с некоторыми погрешностями, которые сказываются 
на его величине, особенно при малых выборках. 

Для того чтобы оценки были более точными, выборка, рас- 
пределяемая в вариационный ряд, должна содержать не менее 
50 вариант. Поэтому часто считают, что применение критерия 
х? требует, чтобы в крайних классах вариационного ряда со- 
держалось не менее пяти вариант. Если в крайних классах со- 
держится меньше чем пять вариант, то вычисленные и эмпири- 
ческие частоты объединяются до указанного минимума и со- 
ответственно уменьшается число классов вариационного ряда '. 


1 Существует инаи точка зреиии на мииимальиые значении теоретнческих 
частот |’, которые могут находиться в разных классах вариациониого ряда. 
Согласно ей, при п2>50 и ЁР6 одно из зиачений |’ может быть снижено да“ 
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Тисло степеней свободы устанавливают по вторичному числу 
‹лассов с учетом ограничений свободы вариации, которая в 
‚азных случаях бывает различной. Так, при оценке эмпириче- 
ких распределений, следующих нормальному закону, число 
зтепеней свободы Ё==М—3 (с учетом трех ограничений свободы 
зариации: п, Хи $»). Если же оценке подлежит распределение, 
‘ледующее закону Пуассона, число степеней свободы уменьша- 
тся на единицу, т. е. А=Мр—2 (с учетом двух ограничений 
"вободы вариации п и $х? или х). В других случаях число сте- 
‹еней свободы устанавливают особо (см. ниже). 


Таблнца 45 
Частоты 
| а-г | аё о |1 2. 
а за Г. ГА =. 9 л 
ори ВЕНЫ 7 $ (7) 79 
1 2 з 4 5 6 7 8 9 
а |2 о }и 6 04 0,16 0,01 | 0,0594 | 0,9406 | 10,91 0,01 
31 34,3 3,3 | 10,89 | 0,32 | 0,1736 | 0,8264 | 28,35 | 0,38 
71 67,8 3,2 | 10,24 | 0,15 | 0,3429 | 0,6571 | 44,55 | 0,23 
82 77,6 4,4 | 19,36 | 0,25 | 03918 | 0,6082 | 47,20 0,41 
46 51,2 5,2 | 27,04 | 0,53 | 0,2589 [0,7411 | 37,94 0,71 
19 19,5 0,5 0,25 | 0,01 | 0,0989 | 0,9011 | 17,57 | 0,01 
5 } 6 4,4 50 1,0 1,00 0,20 | 0,0247 | 0,9753 4,88 | 0,20 
1 0,6 " 
У=267 1=267 — — 1,47 — — — у= 


Примечание. Последнне четыре графы понадобятся в дальнейшем (см. 
прнмер 7 разд. УІ.3). 


На величине критерия %? сказывается степень точности, с 
‹акой определены теоретически вычисленные или ожидаемые 
тастоты. Поэтому при сопоставлении эмпирических частот с 
зычисленными частотами последние не следует округлять до 
{елых чисел !, 

Нулевая гипотеза сводится к предположению, что различия, 
наблюдаемые между эмпирическими и вычисленными или ожи- 
даемыми частотами, носят исключительно случайный характер. 
Для проверки нулевой гипотезы нужно фактически полученную 
зеличину $? сравнить с ее критическим значением х?;:. Если 


"е до 0,5. Прн &=2 мнннмальное значение ѓ' составляет 2. И только при #=1 
аннмальное значение |’ должно быть не менее 4. (Прим. ред.) 

1 Технику расчета теоретнческих частот варнационного ряда см. в 
абл, 30. р 


139 


$? 22°, то нулевая гипотеза должна быть отвергнута на при- 
нятом уровне значимости с числом степеней свободы №. Кри- 
тические точки х?.: приведены в табл. УП Приложений. 

Пример 1. В табл. 28 приведены эмпирические и вычислен- 
ные по нормальному закону частоты распределения длины те- 
ла у 267 мужчин. Из приведенных данных видно, что между 
эмпирическими и вычисленными частотами нет полного совпа- 
дения. Нужно установить, случайны или закономерны эти раз- 
личия, т. е. выяснить, следует ли это распределенне нормаль- 
ному закону. Расчет х?-критерия, который оказался равным 
1,47, приведен в табл. 45. 

В данном случае число вторичных классов М==7. Число 
степеней свободы Ё==7—3==4. Исходя из 5%-ного уровня зна- 
чимости в табл. УП Приложений находим %2;:==9,49. Эта ве- 
личина значительно превышает уф? ==1,47, что не позволяет от- 
вергнуть Но-гипотезу. Следовательно, существуют достаточные 
основания для утверждения, что данное распределение следует 
нормальному закону. 

Критерий х? применяют и для оценки сходства между ва- 
риационными рядами, частоты которых распределяются в гра- 
ницах одних и тех же классов. В таких случаях критерий х? 
определяют по формулам: 


971 
при ии==иИ. у2=4 №; 100 
ри № 2 Я л+л (100) 
7: 2 1 
Раны й 101 
пела е Ет | (101) 


В этих формулах | и ѓ — частоты сравниваемых распределе- 
ний; љ== Х|, — объем одного (любого), а пг== ў, — объем дру- 
гого ряда распределения; М==п.-п›. Число степеней свобол!: 
Е определяют по числу классов № без единицы, т. е. Ё==М№М—1. 
При этом частоты, меньшие 5, не объединяют, как это приня- 
то в отиошении теоретически вычисленных частот. 

Пример 2. Урожай фасоли, полученный иа делянках от по- 
сева крупных | и мелких ў: семян, распределился следующим 
образом (табл. 46). 

С помощью формулы (100) находим у? ==4. 104,78—200--200== 
==419,12—400==19,12. Эта величина не превышает критическую 
точку %2;:==20,09 для Ё==9—1==8 и 1%-ного уровня значимо- 
сти (см. табл. УП Приложений), что не дает оснований для 
непринятия нулевой гипотезы. Следовательно, наблюдаемые 
между частотами этих рядов различия носят не систематиче- 
ский, а случайный характер. 


+ См.: Плохинский Н. А. Алгорнтмы бнометрнн. М., 1980. С. 101, 
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Таблица 46 


Частоты я 
м Ј 
те р р р? Һ+РҺ РТТ 
125 1 1 1 9 0,50 
175 5 3 25 8 3,12 
225 17 Т 289 24 12,04 
275 45 22 2025 67 30,22 
325 70 88 4900 158 31,01 
375 51 69 2601 120 21,68 
425 10 Т 100 17 5,88 
475 1 2 1 З 0,33 
525 0 1 0 1 0,00 
Сумма 200 200 — — 104,78 


Пример 38. Изучали основной вид очанки (Бирйгаза ргаіси- 
гіа Сг.) и одну из ее разновидностей (Е. сига Ег.) — расте- 
ния, произрастающего в центральных областях европейской 
части РСФСР. Анализ вида производили по числу растений, 
зацветающих из того или иного (по счету) узла. Нужно было 
выяснить, в какой мере основной вид очанки отличается от ее 
разновидности, что имеет прямое отношение к проблеме видо: 
образования, совершающегося в природе. Результаты наблюде- 
ний и их обработка приведены в табл. 47. 

Используя формулу (101), находим хф?==[177?2/ (124Ж 
Ж53)] (91,71—1242/177) =4,767 (91,71—86,87) =23,07. Эта вели- 
чина превосходит критическую точку %2;:==21,67 для Е=10— 
—1==9 и 1%-ного уровня значимости (см. табл. УП Приложе- 
ний). Следовательно, на высоком уровне значимости (Р< 0,01) 
можно заключить, что основной вид очанки и ее разновидность 
достоверно различаются по числу растений, зацветающих из 
того или иного (по счету) узла. Этот вывод, вероятно, позво- 
ляет рассматривать разновидность очанки (Е. сигіа Ег.) какза- 
рождающийся вид. 

При группировке выборки в четырехпольную или много- 
польную таблицы критерий ух? определяют по следующей фор- 
муле: 


а? 5 аһ | 
о НУ, (102) 
2 Я 2 п 


где 4 — разница между эмпирическими и теоретически вычис- 
ленными или ожидаемыми частотами; ѓ' — ожидаемые частоты. 
Нулевую гипотезу, или предположение от отсутствии до- 
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стоверных различий между эмпирическими и ожидаемыми ча‹ 
тотами, проверяют с помощью табл. УП Приложеиий, в коте 
рой приведеиы критические точки х?.: для разных уровней зна 
чимости а и чисел степеней свободы №. Но-гипотеза отвергает 
ся, если 7525? для принятого уровня значимости и числ: 
степеней свободы, определяемого по числу строк и столбцое 
(без учета итогов таблицы) по следующей формуле: 


где с — число строк, г — число граф или столбцов таблицы. 


Таблица 4” 
Колнчество Частоты р 
узлов 1 
В № 
а, А А " ГТА 
6 1 0 1 1 1,00 
7 8 0 8 64 8,00 
8 23 1 24 529 22,04 
9 30 11 41 900 21,95 
10 38 18 56 1444 257,8 
И 12 14 26 144 5,54 
12 7 3 10 49 4,90 
13 4 4 8 16 2,00 
14 1 1 2 1 0,50 
15 0 1 1 0 0,00 
Сумма 124 53 177 — 91,71 


При этом, как и при распределении выборки в вариацион 
ный ряд, правильное применение критерия х? основано на тре- 
бовании, чтобы в клетках таблицы было не меньше пяти ожи- 
даемых или теоретически вычисленных вариант!. Кроме того, 
критерий Хх? не следует применять к выборкам, значения кото- 
рых выражены в процентах или другими относительными чис- 
лами. 

Пример 4. В классических опытах Г. Менделя по многогиб- 
ридным скрещиваниям разных сортов гороха, отличающихся 
друг от друга по форме и окраске семян, было получено в 
первом опыте 330 круглых и 101 угловатых, а во втором — 
355 желтых и 123 зеленых семени. Соответствуют ли эти дан- 
ные ожидаемому по схеме Менделя расщеплению признаков 
в гибридном потомстве в отношении 3:1? Чтобы ответить на 
этот вопрос, нужно рассчитать ожидаемые частоты с доминант- 


1 См, примечание редактора к с, 138, 
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зыми и рецессивными признаками, а затем сравнить их с по- 
тученными в опыте. Так, из общего числа 330--101=431 соб- 
занных в первом случае семян ожидали {3/4)431=324,25 круг- 
зых и (1/4)431=107,75 угловатых. Во втором случае из 355-- 
1-123=478 семян ожидали (3/4)478=358,50 желтых и 
1/4)478= 119,50 зеленых семян. Сопоставляем эти величины с 
оответствующими данными опыта (табл. 48). 


Таблица 48 
Форма семян Окраска семян 
Всего Всего 
Показатели углова- семян семян 
круглая тая желтая зеленая 

Ї 330 | 101 431 | 355 123 | 478 

Р 323,25 107,75 431 358,5 119,5 478 

а 6,75 6,75 — 3,5 3,5 — 

а? 45,56 45,56 — 12,25 12,25 — 
а! 0,14 0,42 0,56 0,034 0,103 0,137 


Критерий %12==0,56 и х2?==0,14. Эти величины не превыша- 
эт критическую точку %2;:==3,84 для == (2—1) (2—1) ==1 и 
:ф-ного уровия значимости, что не дает оснований для отвер- 
ания нулевой гипотезы. Следовательно, данные опыта не про- 
‘иворечат ожидаемому по схеме Менделя соотношению доми- 
:антных признаков и рецессивных 3:1. 


Таблица 49 
п Желтые Желтые Зеленые Зеленые Всего 
оказатели тладкие морщини- гладкие морщини- семяя 
стые стые 
Р | 315 | 108 101 | 32 | 556 
Р 313 104 104 35 556 
а 2 4 3 3 — 
а? 4 16 9 9 — 
ФР 0,01 0,15 0,09 0,26 0,51 


Пример 5. В другом опыте Менделя в потомстве Ё; от посе- 
за гибридных семян произошло расщепление на 315 желтых 
‘ладких, 108 желтых морщинистых, 101 зеленых гладких и 32 
зеленых морщинистых семени. Необходимо выяснить, соответ- 
твуют ли эти данные ожидаемому по схеме Менделя расщеп- 
гению признаков в соотношении 9:3:3:1, 
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Как и в предыдущем случае, находим ожидаемые частоте: 
(9/16)556==313; (3/16)556==104 и (1/16)556=35. Сравниваем 
полученные в опыте и рассчитанные по схеме Менделя частс 
ты (табл. 49). В данном случае хф?==0,51. Для == (4—1) (2— 
—1) ==3 и 5%-ного уровня значимости в табл. УП Приложених. 
находим 42;:==7,82. Так как уф? <Х2:ь нет оснований возражать 
против нулевой гипотезы. Это означает, что данные опыта до 
стоверно согласуются с ожидаемым соотношением 9:3:3:1. 

В тех случаях, когда результаты наблюдений группируются 
в четырехпольную таблицу по схеме опыт — контроль, крит- 
рий х? определяют по следующей формуле: 


п (м-в) 
— о, 
ас @ +00 а) 


где а, 6, си 4— численности групп, помещенные в клетках че 
тырехпольной таблицы, а п=а+-6--с--4 — общее число нас 
людений. 


(103 


Таблица 51 
Число семян в корзинке 
Опыление Всего семян 
заполненных пустых 

Естественное 4==113 6=42 а4-0 =155 

(контроль) 
Добавочное 

(опыт) С==18] а= 1] сй == 149 


В сего а + с=244 + = 53 п=297 


Пример 6. Испытывали влияние добавочного опыления нг 
урожай подсолнечника. Полученные результаты приведены Е 
табл. 50. 

Из табл. 50 видно, что добавочное опыление дает прибавк“ 
урожая этой культуры. Применим критерий х? к оценке пе 
лученных результатов: 


е Н я. Е 2 
Таа 297 (| 113.11 — 42.1311 — 297/2) — 17.63. 
Ф 244.53. 155.142 


Эта величина превосходит критическую. точку х?;:==10,83 для 
Е==1 и 0,1%-ного уровня значимости, что позволяет отвергнут» 
нулевую гипотезу на высоком уровне значимости (Р< 0,001, 
Разницу между контролем и опытом следует признать стать 
стически достоверной. : 
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Из приведенного примера видно, что применение формулы 
(103) осложняет вычислительную работу, особенно при нали- 
чии многозначных чисел. Это неудобство можно обойти исполь- 
зуя следующую формулу: 


ху. ; (104) 
ф-1 7 


где == (:—[') — разность между наблюдаемыми | и ожидае- 
мыми или вычисленными | численностями групп, которые рас- 
считывают по формуле : 
у=, (105) 
М: 

Здесь п. — итоги частот по строке, а л, — итоги частот по гра- 
фам или столбцам четырехпольной или многопольной таблицы; 
№М= пс- п; — общее число наблюдений. 

Применим формулы (104) и (105) к только что рассмот- 
ренному примеру. Расчет величины критерия 5х? показан в 
табл. 51. 


Таблица 51 


Частоты 
{4—0,5)* 
наблюдае- вычнслеи- [--Р-а 1—0,5 (4-0,5) РА 
мые } ные Р 
113 127,3 14,3 13,8 190,44 1,5 
131 116,7 14,3 13,8 190,44 1,6 
42 27,7 14,3 13,8 190,44 6,9 
П 25,3 14,3 13,8 190,44 7,5 
7=9297 | Х==297 | — | — | — | Я == 17,5 


Приведенные во второй графе вычисленные частоты (Р) 
получены следующим образом: }1’== (244.155)/297==127,3 (см. 
табл. 51); р2’== (244.142)/297=116,7; ўз’ == (53.155) /297 =27,7 
и [= (53.142)/297=25,3. Остальные действия понятны из 
табл. 51. Суммируя последний столбец этой таблицы, находим 
Ф? == 17,5. | 


\У1.3. КРИТЕРИЙ ЯСТРЕМСКОГО 7 


Задавшись целью исследовать критерий согласия у? Пирсо- 
на на его практическую годность, проф. Б. С. Ястремский на- 
шел, что закон распределения ху? не дает базы для суждения о 
степени близости между теоретически вычисленными и эмпи- 
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рически наблюденными частотами. Критерий у? указывает не 
на степень сходства между эмпирическими и вычисленными 
частотами, а лишь на вероятностную оценку расхождения меж- 
ду ними. Имея в виду эту особенность х?-критерия, Ястремский 
(1948) построил другой критерий согласия, который в общем 
виде записывается так: 


___ 16-м] 


ру 
где с=у ЧЕЛ ; М — число групп или классов вариацион- 


ного ряда (разность |С—М| берут без учета знака); Ө — вели- 
чина, зависящая от числа групп №; при №=206 не превосхо- 
дит 0,6. Так как число классов или групп обычно не превы- 
шает 20, то величину 40 можно считать равной 2,4; ф== 1—р, 
где р={(Е), т. е. функция нормированного отклонения, а ѓ и 
Р/ — соответственно эмпирические и вычисленные частоты ряда. 

Величина Ј имеет непрерывную функцию распределеиия и 
подчинена нормальному закону. Следовательно, с вероятностью 
Р =99,5% можно утверждать, что различия, наблюдаемые 
между эмпирическими { и вычисленными | частотами носят 
случайный характер, если /= 3,0. 

Пример 7. Применим критерий согласия Ястремского к 
оценке ряда распределения длины тела у 267 мужчин. Необ- 
ходимые данные содержатся в табл. 45. В последних четырех 
столбцах этой таблицы показан расчет величины С, входящей 
в состав формулы Ястремского, которая оказалась равной 1,95. 
Эта величина рассчитана следующим образом. В табл. 45 при- 
ведены значения функции |(Г), соответствующие нормирован- 
ным отклонениям членов ряда #= (х:—%)/5х (см. табл. 28). 
Так как частоты классов объединены, то и значения |({) тоже 
объединяются. Так, первая варианта х; отклоняется от средней 
на {=—2,77. Этой величине отвечает }({) =0,0086 (см. табл. П 
Приложений). Соседняя варианта х: отклоняется от средней 
на {=—2,03. Этой величине соответствует {(Р) =0,0508, поэтому 
КИ =0,0086--0,0508— 0,0594. Эта величина и записана в 6-м 
столбце табл. 45. Остальные действия понятны из той же таб- 
лицы. 

Число вторичных классов равно 7. Подставляя известные 
величины в формулу (106), находим /== (1,95—7) // 2.7--2,4== 
=5,05/4,05= 1,25, Эта величина не превышает даже 5%-ного 
уровня значимости, которому отвечает {==1,96, что не дает ос- 
нований для отвергания Но-гипотезы. Следовательно, можно 
утверждать, что вычисленные по нормальному закону частоты 
хорошо согласуются с частотами данного эмпирического ряда. 

При использовании /-критерия частоты классов ряда, мень- 
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пие пяти, можно не объединять. Принято также вычислять 
-критерий упрощенным и приближенным способом, придавая 
зеличине С, входящей в состав формулы (106), следующее зна- 


ление: с=У 27. Такого рода преобразования сокра- 


цают затраты времени и объем вычислительной работы при 
‚пределении величины /-критерия Ястремского. 

Пример 8. В табл. 27 содержатся эмпирические и вычислен- 
‹ые частоты распределения 517 случаев поражения клеток аль- 
оа-частицами. Проверим, отвечает ли это распределение зако- 
у Пуассона. Расчет вспомогательных величин приведен в 
“абл. 52 (вычисление частот см. в табл. 26). 


Таблица 52 
Количество Частоты 
поражений Разница Є 220 
клеток наблюдае- вычислеи- а=|—Р Ф - Г 
В мые } ные Р 
0 112 115,34 `3,34 11,1556 0,10 
1 168 173,04 5,04 25,4016 0,15 
2 130 129,77 0,23 0,0529 0,00 
3 68 64,88 3,12 9,7344 0,15 
4 32 24,35 7,65 58,5225 2,40 
5 5 7,29 2,29 5,2441 0,72 
6 1 1,81 0,81 0,6561 0,36 
7 1 0,41 0,59 0,3481 0,85 
Сумма 517 516,90 — к 4,73 


В данном случае число классов равно 8, а С==4,73. Под- 
тавляя эти величины в формулу (106), находим 


уЗ 9-3 184 4,29 


"ак как /<3, расхождения между эмпирическими и вычислен- 
ыми по формуле Пуассона частотами данного ряда можно 
‘читать случайными. 

Пример 9. Применим критерий согласия Ястремского к оцен- 
:е расхождения между эмпирическими и вычисленными по 
оормуле Шарлье (50) частотами распределения 200 хвоинок 
‘‹осны обыкновенной. Необходимые данные содержатся в табл. 
23,34. Расчет величины С приведен в табл. 53. 


В данном случае С==15,04, число классов равно 13. Отсюда 
15.4131 204 2.4 (дт, 
У18 + 2,4 Уд _ 74,32. 
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Таблица 53 


Частоты 


го 


о --оооомом№оо- 
Оол ооо 


Моло ьо о-оо 


У 


0 
2 
3 
7 
13 
22 
32, 
39 
37 
25 
12 
3 
0 


5 
© 
> 
© 
| 


Так как /<3, можно считать, что формула (50) выбрана пра- 
вильно и что между эмпирическими и вычисленными по этой 
формуле частотами существует полное согласие. 


\1.4. ПРИЧИНЫ АСИММЕТРИИ ЭМПИРИЧЕСКИХ 
РАСПРЕДЕЛЕНИЙ 


А. Кетле и Ф. Гальтои считали, что биологические признаки 
распределяются нормально. Вскоре, однако, К. Пирсон пока- 
зал, что существует не один, а несколько типов распределений. 
Возникла необходимость выяснить причины различных откло- 
нений от нормальной кривой. Решение этого вопроса имеет 
свою историю, останавливаться на которой не входит в задачу 
данного пособия. 

В настоящее время можно указать иа следующие причины 
возникиовения асимметричных распределеиий. Одна из них — 
чисто механическая, связаиная с «неправильной» группировкой 
выборочиых данных в вариационный ряд. Впервые на это ука- 
зал В. Иогансен. Отобрав 1522 фасолины и измерив каждую 
в сантиграммах (сг), он распределил их в вариационный ряд: 


ху 8,75—9,75—10,75—11,75—12,75—13,75—14, № 75 - 
ГА 2 43 314 809 316 30 6 


Характеристики этого симметричного ряда следующие: #== 
== 19,95 сг; 5.==0,82; 45==0,17--0,063. 
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Затем границы классов были изменены путем округления 
робей до целых чисел и частоты вариант распределились по 
‹лассам следующим образом: 


Классы х; ВИЕ иЕе 
Частоты ѓ 7 67 466 761 201 15 4 


Характеристики этого ряда оказались следующие: #== 
= 192,95 сг; 5.==0,82; 45= 0,750,063. Из приведенных данных 
идно, что в результате незначительных изменений границ 
‹лассов средняя арифметическая и среднее квадратическое от- 
‹лонение остались без изменения, тогда как коэффициент асим- 
ҳетрии 45 увеличился более чем в четыре раза. 


Таблица 54 
Среднее Коэффициент 
Количество Измерено р: квадратн- 
расоии колосьев п колосьев х, отклонение 
мм 5, коркар асинметрин 

197 132 64,0 19,0 27,7 +0,004 

292 115 63,3 18,5 29,2 0,410 

364 182 49,3 18,2 36,9 0,620 


Такого рода асимметрию Иогансен назвал кажущейся или 
.ожной, возникшей исключительно вследствие технических при- 
тин. Отсюда следует, насколько важно соблюдение выработан- 
чых правил распределения результатов наблюдений в интер- 
зальной вариационный ряд. 

Другая причина возникновения асимметрии — это модифи- 
шрующие условия внешней среды, в которой происходит раз- 
зитие организма и формируются количественные признаки. 
1звестно, например, что засуха, невыравненность почвенного 
титания растений и т. п. факторы среды вызывают асиммет- 
зию в распределении хозяйственно полезных признаков. Заме- 
тено также, что прн прочих равных условиях характеристики 
'яда распределения размеров колосьев у озимой ржи находят- 
я в зависимости от густоты стояния растений в посеве этой 
‘ультуры (табл. 54). 

Из табл. 54 видно, что с увеличением численности растений 
1а единице площади средняя длина колосьев уменьшается и, 
‹ак следствие, происходит увеличение коэффициента вариации 
три более или менее стабильной величине среднего квадрати- 
ческого отклонения. Особенно сильно увеличивается коэффи- 
{иент асимметрии. 
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Существует и еще одна причина возникновения асиммет- 
рии — генетическая, обусловленная взаимодействием аллель- 
ных и неаллельных активных генов. Известно, что количест- 
венные признаки наследуются полигенно. При отсутствии до- 
минирования, эпистаза и других способов взаимодействия не- 
аллельных генов действие аддитивных, т. е. однозначных или 
сходных по силе действия на признак, генов обусловливает про- 
межуточный тип наследования, их нормальное распределение. 
Если же в процессе формирования признака имеет место взаи- 
модействие генов, при котором одни активные гены подавляют 
или ограничивают активность других, то промежуточного типа 
наследования признака наблюдаться не будет и кривая распре- 
деления такого признака окажется асимметричной. 

Каждая из названных причин действует на признак не изо- 
лированно, а, как правило, суммарно, поэтому без строгого 
статистического и генетического анализа нельзя выявить кон- 
кретную причину, вызывающую отклонение эмпирического рас- 
пределения от нормальной кривой. Во всяком случае отклоне- 
ния вариационных кривых от нормального закона, если они не 
случайны, могут указывать на постоянно действующую причи- 
ну или причины, вызывающие асимметрию изучаемого призна- 
ка, выяснение которых является больше задачей биологии, чем 
биометрии, 


\1.5. ОЦЕНКА ТРАНСГРЕССИИ РЯДОВ 


При распределении независимых выборок, взятых из раз- 
ных генеральных совокупностей, нередко случается, что неко- 
торая часть членов этих выборок оказывается в одних и тех 
же классах вариационного ряда. Такие ряды, у которых часть 
классов оказывается общей (несмотря на то что между сред- 
ними арифметическими этих рядов может быть статистически 
достоверная разница), называют трансгрессирующими, а сам 
факт неполного разобщения вариационных рядов и их графи- 
ков — трансгрессией. 

Вариационные кривые трансгрессирующих рядов выглядят 
так, что правая сторона одной кривой и левая сторона другой 
взаимно проникают друг в друга, так что под ними образуется 
часть общей площади в системе прямоугольных координат, по- 
казывающая величину трансгрессии. 

В табл. 55 приведены ряды распределения кальция в сыво- 
ротке крови обезьян, страдавших припадками тетании (боль- 
ных) и клинически здоровых. Из той же таблицы видно, что 
часть членов каждой из выборок распределилась по одним и 
тем же классам. Между тем разница Х2—%!==11,90—8,92 == 
= (2,98-0,21) мгф оказывается статистически достоверной. 
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Это пример трансгрессирующих рядов выборок из разных 
генеральных совокупностей, каждая из которых характеризует- 
ся своими параметрами. Наличие гипокальцемии в сыворотке 
крови, взятой у больных обезьян, — характерный признак их 
патологического состояния, связанного с гипофункцией пара- 
щитовидных желез. Однако, учитывая, что ряды распределения 
трансгрессируют, нельзя утверждать, что гипокальцемия — 
единственная причина возникновения припадков тетании у 
обезьян. 

Таблица 55 


Частоты вариационных рядов 


Срединные 
Классы по уровню кальция значения 
в сыворотке крови, мг % класса х; бораниЕ у; здоровых й 
6,45 —7,14 6,8 2 
7,15—7,84 7,5 6 
7,85—8,54 8,2 7 
8,55—9,24 8,9 12 2 
9,25 —9,94 9,6 9 3 
9,95—10,64 10,3 2 9 
10,65—11,34 11,0 3 17 
11,35—12,04 11,7 1 25 
12,05—12,74 12,4 23 
12,75—13,44 13,1 10 
13,45—14,14 13,8 7 
14,15—14,84 14,5 4 
Сумма — 42 100 
Средняя арифметическая & 8,92 11,90 
Средиее квадратическое от- 
клоиение 5х 1,13 1,20 


Величину трансгрессии можно измерить, выразив сумму 
трансгрессирующих вариант в процентах от общей численно- 
сти обеих выборок. Так, из табл. 55 следует, что из 142 вари- 
ант трансгрессируют в первом ряду 1У4-3--2--94-12==27, а во 
втором — 2--3--9--17--25==56 вариант, всего трансгрессируют 
27--56=83 варианты, что составляет 58,5 от общего числа 
наблюдений. Это довольно значительная трансгрессия: больше 
половины членов двух выборок распределяется по одним и тем 
же классам вариационного ряда. Понятно, что этот способ из- 
мерения величины трансгрессии не точен и дает лишь прибли- 
женное представление о ее размере. Более точно рассчитать 
величину трансгрессии Тг для нормально распределяющихся 
совокупностей можно с помощью следующей формулы: 
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где т и пг — объемы сопоставляемых распределений; Р!= 


=0,5--0,5Ф(&) и Р›=0,5--0,5Ф(Ь). Здесь пет и 
1 
=, а тіпг==—35: и тах,=Х.--38;. Значения 
2 

тіпг, шах, Ф(Ё) и Ф(Ь) легче уяснить из рис. 23, на котором 
изображены выровненные кривые распределения кальция всы- 
воротке крови больных и здоровых обезьян. Остальные сим- 
волы объяснены выше. 

Показатель трансгрессии выражают в долях единицы или 
процентах. Значения функции Ф({) приведены в табл. І Прило- 
жений; эти значения нужно брать 
с отрицательным знаком, если 
1112> и тах, < Хо, т. е. исхо- 
дить из Р=0,5—0,5Ф (В. 

Пример 10. Рассчитать величи- 
ну трансгрессии между рядами 
распределения кальциия (мгф) в 
сыворотке крови больных и здо- 
ровых обезьян. В данном случае 

тіп тол, х: =8,92 мг% ; = 11,90 мг%; 51 = 

Потоций 6 смйдротле прои, мг ў, = 1,18; 59= 1,20; п, =492; пг= 100. 

Определяем тіпз = 11,90—3 · 1,20 = 

Рис. 23. Траисгрессия рядов рас- : 
пределения кальция Е —8,30; тах, =8,92-3.1,13 = 12,31. 
крови больиых (21) и клиннчески Находим ВН = (8,30—8,92) /1,13== 
здоровых (22) обезьяи —0,55; & == (12,31—11,90)/1,20== 
—0,34. Вычисляем значения Р; = 
=0,5--0,5Ф (—0,55) =0,5--0,20885 =0,70885; Р.=0,5--0,5ФЖ 
Х (0,34) =0,5--0,13305 =0,63305. Подставляем известные величи- 

ны в формулу: 


7] 


Ту —_42-0,10885 + 100.0,63305 _ 93,0767 _ (о 655 или 655%. 


4 42 = 100 142 

Пример 11. В табл. 56 приведены ряды распределения мас- 
сы фасолин, которые были отобраны из урожая | и из посев- 
ного материала ўз. Из данных таблицы видно, что эти ряды 
трансгрессируют, хотя и незначительно: из общего объема двух 
выборок (п==300) трансгрессирует лишь 21 варианта, что со- 
ставляет 7% от их общего числа. Вычислим показатель транс- 
грессии для этих распределений. 

В данном случае #;= 319,0 мг; #›=573,5 мг; $: =58,3; $2 = 
=:59,3. Определяем пт. ==573,5—3.59,3 =395,6; тах, =319,0-- 
--3:58,3 =493,9; == (395,6—319,0) /58,3= 1,31;  Ь == (493,9— 
— 573,5) /59,3 = — 1,34. Отсюда Р; = 0,5 — 0,5Ф (1,31) = 0,5 — 
—0,5.0,8098 =0,095; Р=0,5—0,5Ф (—1,34) =0,5—0,5.0,8198 == 
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=0,090'. Подставляем найденные величины в формулу: 


200.0,095 + 100.0,090 
ии 0,093, или 9,3%. 
200 -+ 100 9% 
ҳак и следовало ожидать, трансгрессия этих рядов оказалась 
{езначительной. 


\1.6. ПРОВЕРКА СОМНИТЕЛЬНЫХ ВАРИАНТ 


Отдельные варианты, попавшие в состав выборки, иногда 
`ильно отличаются от остальных ее членов, так что возникает 
‘мнение в их принадлежности к генеральной совокупности, из 
:оторой взята эта выборка. Сомнительная варианта может по- 


Таблица 56 
Частоты 
Классы для массы фасолин, Оредвянме 
са классов х; урожая ћ\ семян 
100—-149,9 125 1 
150—199,9 175 5 
200—249,9 225 17 
250—299,9 275 45 
300—249,9 325 70 
350—399,9 375 51 
400—449,9 425 10 1 
450—499,9 475 1 9 
500—549,9 525 29 
550—599,9 575 26 
600—649,9 625 25 
650—699,9 675 8 
700—749,9 725 2 
Сумма — 200 100 
Средняя арифметическая х 319,0 573,5 
Среднее квадратическое от- 
клоиеиие $х 58,3 59,3 


тасть в выборку ошибочно, что отразится на выводах, которые 
делают на основании выборочных данных. Такая варианта 
„должна быть исключена при вычислении обобщающих харак- 
"еристик статистической совокупности. Однако произвольно от- 
‚расывать сомнительные варианты нельзя, так как они могут 
іринадлежать к той же генеральной совокупности, из которой 
звлечены и другие члены выборки. Возникает задача статис- 


1 Величины 0,5Ф (4) и 0,5Ф (Ь) взяты с отрицательным зиаком на том ос- 
‘овании, что в данном примере тіп,>?; и тах, <. 
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тической проверки сомнительных вариант, При этом исходят 
из предположения, что сомнительные варианты принадлежат 
к одной и той же нормально распределяющейся генеральной 
совокупности. 

Для проверки этой (нулевой) гипотезы применяют особые 
критерии. В качестве одного из них служит нормированное от- 
клонение і, которое уже упоминалось ранее [см. формулу (20)]. 
Нулевую гипотезу отвергают, если +2: (критические значе- 
ния &: для 5%-ного и 1%-ного уровней значимости с учетом 
объема выборки п приведены в табл. ХУІ Приложений). 

Пример 12. Собранный с шести опытных делянок урожай 
зерна озимой ржи варьировал следующим образом: 


Номера делянок.... 1 2 3 4 5 6 
Урожай, кг...... 21,9 24,6 20,8 25,1 30,8 23,2 


Из приведенных данных выделяется варианта х5==30,8, 
сильно отличающаяся от остальных членов выборки. Нужно 
проверить гипотезу Но о принадлежности этой варианты к дан- 
ной генеральной совокупности. Находим характеристики вы- 


борки: х= ОЕ... М6 2440 кг: 8. 
И == Уи -=И -82,14 12.498 —3,53. Нормируем 
П == 1 5 


варианту 30,8: {= (30,8—24,4) /3,53= 1,81. В табл. ХУІ для а= 
=59 и п==6 находим #:=2,07. Так как %==1,81<.2,07, то ну- 
левую гипотезу отвергнуть нельзя. 

Другие критерии для проверки нулевой гипотезы основаны 
на использовании разностей между сомнительными и соседни: 
ми членами ранжированного ряда. Для этого служат формулы 


ПЕ, пре, (108) 
Я — #1 Хп — Х2 
Вычисление і, применяют для проверки наименьших хі, а ё — 
для проверки наибольших х„ членов ранжированного ряда. Ну- 
левую гипотезу отвергают, если >: для принятого уровня 
значимости а и объема выборки п. Критические точки для ії 
приведены в табл. ХУІІ, а для Ь —в табл. ХУШ Приложений. 
Пример 18. Проверить с помощью критерия Ё& вывод, кото- 
рый был описан при оценке варианты х5 ==30,8. Для этого ран- 
жируем выборку в порядке возрастания числовых значений 
признака: 
Номера по порядку (ран- 
ги) и ела а 1 2 З 4 5 6 
Варианты х; ...... 20,8 21,9 23,2 2456 251 30,8 


Подставляем нужные величины в формулу (108): = 
== (30,8—25,1) / (30,8—21,9) ==5,7/8,9==0,64. В табл. ХУШ При: 
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ложений для а=5% и п==6 находим &,:==0,69. Так как == 
==0,64<< 0,69, это не дает оснований для непринятия нулевой 
гипотезы. Следовательно, все члены данной выборки принад- 
лежат к одной и той же генеральной совокупности и при рас- 
чете среднего урожая нельзя отбрасывать варианту 30,8. 

Пример 14. Рассмотрим выборку следующего состава: 37, 
40, 38, 28, 9, 32, 25, 26, 23 — всего 9 вариант. В данном случае 
вызывает сомнение варианта 9. Проверим ее принадлежность 
к данной генеральной совокупности. Ранжируем выборку сле- 
дующим образом: 


Номера по порядку... 1 2 3 4 5 6 7 8 9 
Варианты х‹...... 9 23 25 26 28 32 37 38 40 


Подставляя нужные величины в формулу, находим і, = (23— 
—9)/ (38—9) =14/29-——0,48. 

Эта величина несколько превышает критическую точку &:== 
==0,44 для а=5% и п==9, что опровергает нулевую гипотезу 
на 5%-ном уровне значимости (см. табл. ХУП Приложений). 
Однако на уровне а==1% нулевая гипотеза сохраняется. Как 
же поступить в таком случае с вариантой 9? Прежде чем при- 
нять окончательное решение по этому вопросу, следует прове- 
рить Но-гипотезу с помощью более мощного параметрического 
критерия — {-нормированного отклонения. Характеристики рас- 
сматриваемой выборки: х=28,67 и 5.=9,59. Отсюда нормиро- 
ванное отклонение Ё, == (9—28,67) /9,59==2,07. По табл. ХУІ 
Приложений для а=5ф и п==9 находим Ё:=2,35. Так как 
4==2,07<2,35, нулевую гипотезу отбросить нельзя. Следова- 
тельно, при расчете обобщающих характеристик выборки оце- 
ниваемую варианту 9 исключать не следует. 


ГЛАВА ҮП 
ДИСПЕРСИОННЫЙ АНАЛИЗ 


Сущность метода. Наряду с относительно простыми спосо- 
бами сравнения одной выборки с другой в исследовательской 
работе встречаются и более сложные задачи, когда приходится 
сравнивать одновременно несколько выборок, объединяемых в 
единый статистический комплекс. В таких случаях метод попар- 
ных сравнений выборочных характеристик оказывается обреме- 
нительным, требующим большой вычислительной работы. Учи- 
тывая это обстоятельство, Р. Фишер (1925) предложил метод 
комплексной оценки сравниваемых средних, получивший назва- 
ние дисперсионного анализа. Этот метод основан на разложе- 
нии общей дисперсии статистического комплекса на составляю- 
щие ее компоненты (отсюда и названне метода), сравнивая 
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которые друг с другом посредством Ё-критерия можно опре- 
делить, какую долю общей вариации учитываемого (результа- 
тивного) признака обусловливает действие на него как регу- 
лируемых, так и не регулируемых в опыте факторов. 

Так, если регулируемый фактор (например, доза удобре- 
ний) оказывает существенное влияние на результативный приз- 
нак (урожай культуры), оно непременно скажется на величине 
групповых средних, которые будут заметно отличаться друг от 
друга. Таким образом, здесь происходит варьирование группо- 
вых средних, причиной которого является влияние регулируе- 
мого фактора. 

Внутри каждой группы, входящей в статистический (дис- 
персионный) комплекс, тоже обнаружится варьирование, выз- 
ванное влиянием на признак не регулируемых в опыте факто- 
ров. Зависимость между этими источниками варьирования вы- 
разитсЯ равенством Р,==2,4-р,, где Р, — межгрупповая де- 
виата, представляющая собой сумму квадратов отклоиений 
групповых средних х; (их общее число — а) от общей средней 
Х комплекса, взвешенную на численность вариант в группах п, 
т. е. р,=У пех 

1=1 1А 
ка) — внутригрупповая девиата, представляющая сумму из 
сумм квадратов отклонений отдельных вариант х; от их груп- 


при №== 2и; О. (от англ. еггог — ошиб- 


а п 
повых средних #;, т. е.2,-= У, Ў (хх) ; Ру — общая де- 
1 17-1 
виата или сумма квадратов отклонений вариант х; (дат, по 
терминологии Фишера) от общей средней х комплекса, т. е. 
р,= У (х, — х). 
Ј=1 

Деление сумм квадратов отклонений (девиат) на числа сте- 
пеней свободы № дает выборочные дисперсии 5,2==],/у; $? == 
== [),/К,; 5е==0./Ё., которые служат оценками соответствую- 
щих генеральных параметров: 5,2 является оценкой общей дис- 
персии всего комплекса 0,2; 5;? — оценкой межгрупповой дис- 
персии 0,2; $? — оценкой внутригрупповой, или остаточной, дис- 
персии ог2. 

Отношение межгрупповой дисперсии (называемой также 
факториальной дисперсией, так как она зависит от действия ре- 
гулируемых факторов) к внутригрупповой, или остаточной, 
дисперсии служит критерием оценки влияния регулируемых в 
опыте факторов на результативный призиак, т. е. Ё==5,2/5? 
(при 5225.2). 

Нулевая гипотеза сводится к предположению, что геиераль- 
ные межгрупповые средние и дисперсии равны между собой и 
различия, наблюдаемые между выборочными показателями, 
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вызваны случайными причннами, а не влиянием на признак ре- 
гулируемых факторов. Нулевую гипотезу отвергают, если Еф 
>> Е,. для принятого уровня значимости а и чисел степеней сво- 
боды ё; и Ё,, и принимают, если РЕф< Е: при этом различия, 
наблюдаемые между групповыми средними комплекса, призна- 
ют статистически недостоверными, 

После того как действие регулируемого фактора, нескольких 
факторов или их совместного действия на признак будет до- 
казано, т. е. окажется статистически достоверным, переходят, 
когда это необходимо, к сравнительной оценке групповых сред- 
них. Заключительным этапом дисперсионного анализа является 
оценка силы влияния отдельных факторов или их совместного 
действия на признак. 

Будучи методом одновременных сравнений выборочных 
средних, дисперсионный анализ предъявляет определенные тре- 
бования к группировке выборочных данных и к планированию 
наблюдений. Результаты наблюдений, подлежащие дисперсион- 
ному анализу, группируют с учетом градаций каждого регули- 
руемого фактора, воздействующего на признак, например по 
дозам удобрений, по срокам или способам внесения их в почву, 
по породной принадлежности экспериментальных животных, их 
возрастному составу и т. д. 

Правильное применение дисперсионного анализа предпола- 
гает также нормальное или близкое к нормальному распреде- 
ление совокупности, из которой взяты выборки, объединяемые 
в дисперсионный комплекс. При этом важно, чтобы дисперсии 
выборочных групп были одинаковыми или не очень сильно от- 
личались друг от друга. Не менее важным является и то, что- 
бы при планировании наблюдений и особенно при обработке 
их результатов в группах дисперсионного комплекса содержа- 
лись одинаковые или пропорциональные числа вариант (дат), 
что значительно облегчает дисперсионный анализ. 

Дисперсиоиный анализ возник в процессе усовершенство- 
вания методики сельскохозяйственного опытного дела. Однако 
вскоре его стали применять не только в биологии и смежных 
с ней областях знания, но и в технике, а затем в психологии и 
педагогике. 

Дисперсионный анализ характеризуется строгой логично: 
стью и последовательностью вычислительных операций. Цен- 
ность этого метода заключается в том, что он позволяет выя- 
вить и суммарное действие факторов, и действие каждого ре- 
гулируемого в опыте фактора в отдельности, и действие раз- 
личных сочетаний факторов друг с другом на результативный 
признак. 

Основные понятия и символы. Признаки, изменяющиеся под 
воздействием тех или иных причин, называют результативны- 
ми. Причины, вызвавшие изменение величины результативного 
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признака или признаков, принято называть факторами. Напри- 
мер, масса тела, его линейные размеры, физическое развитие 
организма; урожайность той или иной культуры; успеваемость 
учащихся и т. д.— все это признаки, на которые оказывают 
влияние самые различные факторы: элементы или режим пи- 
тания, физические или умственные упражнения, дозы лекарст- 
венных или токсических веществ, удобрений и т. д. Факторы 
обозначают прописными начальными буквами латинского ал- 
фавита (4, В, С,...), учитываемые признаки — конечными (Х, 
У, 2). 

Существует много факторов, воздействующих на один и тот 
же признак. В опыте регулируются лишь некоторые из них; 
их называют регулируемыми или организованными факторами 
в отличие от факторов, которые не подвергаются регулирова- 
нию, хотя и оказывают воздействие на-величину результатив- 
ного признака. Обычно каждый регулируемый фактор испыты- 
вают серийно, т. е. в виде нескольких независимых друг от 
друга групп или градаций. 

Градации принято обозначать теми же буквами, что и фак- 
торы. Например, градации фактора А обозначают через А;, Аг, 
Аз ит. д. а градации фактора В — соответственно через Ві, 
В», Вз и т. д. Число градаций того или иного фактора опреде- 
ляется условиями опыта, например испытываемыми дозами 
удобрений, количеством сортов, подвергаемых испытанию на 
урожайность, и т. д. Результативные признаки также могут 
иметь свои градации, на которых испытывают действие регу- 
лируемых факторов. 

Выше было указано, что дисперсионный анализ позволяет 
учитывать различные сочетания действия регулируемых фак- 
торов на результативный признак. Эти свойства не распрост- 
раняются на не регулируемые в опыте факторы, действие ко- 
торых на признак учитывают не дифференцированно, а суммар- 
но. При этом дисперсионный анализ позволяет выражать учиты- 
ваемые признаки не только абсолютными единицами измерения 
и счета, но и в баллах, индексах и других относительных и ус- 
ловных единицах. 


Условия образования и виды дисперсионных комплексов. 
Статистические, или дисперсионные, комплексы могут формиро- 
ваться как в планах намечаемых исследований, так и на ос- 
новании уже собранных данных, подвергаемых дисперсионному 
анализу. При образовании дисперсионных комплексов необхо- 
димо соблюдать по крайней мере два важных условия, гаран- 
тирующих правильное применение дисперсионного анализа. 
1. Действующие на признак регулируемые факторы должны 
быть независимы друг от друга. 2. Выборки, группируемые в 
статистический комплекс, должны производиться по принципу 
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рандомизации, т. е. способом случайного отбора из нормально 
распределяющейся совокупности. 

Структуру дисперсионного комплекса определяет число гра- 
даций регулируемого фактора или факторов, а также число 
подразделений или групп, образуемых по результативному 
признаку. Форму дисперсионного комплекса задают таблицей, 
в которой число строк соответствует числу подразделений ре- 
зультативного признака, а число столбцов равно числу града- 
ций регулируемого фактора или нескольких факторов с их гра- 
дациями. 

Если испытывают действие на признак одного регулируемо- 
го фактора, дисперсионный комплекс будет однофакторным, 
если одновременно исследуют действие на признак двух, трех 
или большего числа регулируемых факторов, комплекс назы: 
вают двух-, трех- и многофакторным. Числовые значения ре- 
зультативного признака, т. е. варианты или даты, могут рас- 
пределяться по градациям комплекса равномерно, пропорцио- 
нально и неравномерно, поэтому дисперсионные комплексы на- 
зывают равномерными, пропорциональными и неравномерными. 
Равномерные и пропорциональные комплексы носят общее на- 
звание ортогональные, а неравномерные комплексы называют 
неортогональными. 

В ортогональных комплексах осуществляется равенство 
ру=Ёр,-+р,; в двухфакторных — Р,=р,+Рв--Рав4-Ре; в не- 
ортогональных комплексах это равенство нарушается. Эту осо- 
бенность следует учитывать при планировании опытов, а при 
проведении дисперсиоиного анализа — стремиться к тому, что- 
бы в градациях многофакторного комплекса были одинаковые 
или пропорциональные числа вариант, что значительно облег- 
чает и упрощает вычислительную работу. 


ҮП.4. АНАЛИЗ ОДНОФАКТОРНЫХ КОМПЛЕКСОВ 


Равночисленные комплексы. Однофакторные дисперсионные 
комплексы могут быть равномерными и неравномерными. Не- 
зависимо от этого техника дисперсионного анализа однофак- 
торных комплексов сводится главным образом к расчету по- 
казателей варьирования, которыми в области дисперсионного 
анализа служат средние квадраты отклонений, или дисперсии, 
а также к расчету групповых средних #; и общей средней ариф- 
метической для всего комплекса Х. Обычно дисперсионный ана- 
лиз проводят по определенной схеме. Дисперсионный анализ 
однофакторных равномерных комплексов удобно проводить по 
следующей схеме. 

1. Первичные данные, подлежащие дисперсионному анали- 
зу, группируют в виде комбинационной таблицы, в которой гра- 
дации организованного (регулируемого) фактора А обычно 
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располагают по горизонталн в верхней части таблицы, а чнс- 
ловые значения признака Х, т. е. варианты х, или даты, разме- 
щают соответственно по градациям фактора А (см. для приме- 
ра табл. 59). Можно избрать и другую форму группировки (см. 
ниже), но предлагаемая здесь форма очень удобна при вычис- 
лении вспомогательных величин, необходимых для расчета де- 
виат. 

2. Сгруппировав исходные данные, как указано в п. 1, при- 
ступают к расчету вспомогательных величин Ух, Х(Ух;)? и 
Ух. 

3. Затем переходят к расчету девиат: 


м 
у= 2н; (109) 
і=1 


а 

хт)? 

рл=У-@2 н или в случае равномерного комплекса 
п 


а а 
2 = 
рл= ЁО н нли Ра=п ЎН; (110) 


№ 
р.=Уж— 2 или О,=ру Юра. (11) 


1-1 


Повторяемая в этих формулах величина Н = (Ўх;)?/№, где х; — 
варианты, или даты, входящие в состав комплекса; М==Уп — 
общее число наблюдений, илн объем комплекса; и — числен- 
ность варнант х; в каждой из градаций дисперсионного комп- 
лекса. Да — факториальная девиата, характеризующая меж- 
групповое варьирование не вообще (как девиата О,), а при- 
менительно к конкретному фактору, который здесь обозначен 
буквой А. Между О; и РА существует принципиальная разни- 
ца, хотя в однофакторных комплексах она неощутима. 

4. Закончив расчет девиат, переходят к определению чисел 
степеней свободы №, которые равны: 


#,=М —1 для общего варьирования; 
Ед==а — 1 для факториального варьирования; 
Е. =(М№М—1) —(а—1)=М№М —– а для остаточной вариации. 


Через а обозначено число градаций фактора А. 

Как и равенство О,==Д,--О., числа степеней свободы на- 
ходятся между собой в определенных количественных соотно- 
шениях: А,==й,--й.. Этн равенства позволяют контролировать 
правильность расчета как девнат, так и чисел степеней сво- 
боды. 
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5. Делением девиат на соответствующие числа степеней 
свободы получают выборочные дисперсии: 


2 РА 
52 = | общая для всего комплекса, 


р 
Е е, межгрупповая, или факториальная; 


Гр) 
52 =-—_ внутригрупповая, или остаточная. 
—а | 


6. Наконец определяют дисперсионное отношение Е==5д?/ 
5е? (при 5425.2), по которому судят о действии фактора А на 
результативный признак. Так как фактически полученное дис- 
персионное отношение (Ръ=5л?/5г?) является величиной слу- 
чайной, его необходимо сравнить с табличным (стандартным) 
значением критерия Фишера ЁР;, для принятого уровня значи- 
мости а и чисел степеней свободы Ёа и Ё. При этом число 
степеней свободы для болыней дисперсии находят в верхней 
строке, а для меньшей — в первом столбце таблицы Фишера 
(см. табл. УТ Приложений). 


Таблица 57 
Суммы 
Числа квадратов Средиие квадраты | Дисперсиониое 
Вариация степеией отклоиений, отклонеинй, отношеине Ё 
свободы ё или илн днсперсии 5? Ф 
девиаты Р 

Факториальиая |ёд ==а—1 "РА ° 5а2== р А|ВА Еф==5 4/5, 
Остаточная Ёе== М№Ү-а Р, 5е2==р),|Е, — 
Общая Ву== №—1 р, ѕу2== [еу =; 


Нулевую гипотезу отвергают и эффективность действия фак- 
тора А на результативный признак Х признают статистически 
достоверной, если Е. >Р.:; в противном случае отвергать нуле- 
вую гипотезу нельзя. 

Обычно результаты дисперсионного анализа сводят в таб- 
пицу, общий вид которой представлен в табл. 57. 

ример 1. На учебно-опытном участке агростанции изуча- 
ли влияние различных способов внесения в почву органиче- 
ских удобрений на урожай зеленой массы кукурузы. Опыт про- 
водили на десятиметровых делянках в трех вариантах, не счи- 
тая контроля. Каждый вариант опыта имел трехкратную пов- 
торность. Результаты опыта приведены в табл. 58, 
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Из данных табл. 58 видно, что полученные результаты варь- 
ируют как по вариантам, так и по повторностям. Чтобы уста 
новить, случайны или достоверны различия между средниме 


Таблица 5: 
Урожай по повторностям, кг 
Варианты опыта 1 А | з ААУ т 

Коитроль 21,2 28,0 31,2 26,8 
Удобрения помещали: 

ииже семян иа 4 см 23,6 22,6 28,0 24,7 

в стороие от семян на 4 см 24,0 30,0 29,2 27,7 

выше заделки семян иа 4 см 29,2 28,0 27,0 28,1 


арифметическими групп, подвергнем эти данные дисперсионне-- 
му анализу. Обозначим фактор, регулируемый в опыте, чере: 
А, а его градации (варианты опыта) — соответственно чере 
А, А», Аз и А. Для упрощения расчетов вспомогательных вє 


Таблица 5: 
Градации фактора А (варианты опыта) 
Урожай по та 
потям А А А А 
—20 1,2 3,6 4,0 9,2 а==4 
Е 80 | 26 | 100 | 80 
11,2 8,0 2 7,0 
ЕРО НЕННЕ НАЛЕТ. НИРКА ННН ЕЛЕ РНИ Е ЗЕ ЦЬЕЕЬАЕРЕНЕНРЕИНЦЕРАЕ 
СЕСЕ ИЕ а 
ОРЕЛА НИЕ ЧЕИИН НИРС НЕЕ ЕНИНИБЦЕНИРННЕНЕНЕЧЕУЕНИНИЕНЕ 
| 20,4 | 14,2 | 23,2 | 24,2 | Ух:== 82 
(Хх:)? | 416,16 | 201,64 | 538,24 | 585,64 | $(3%:)2==1741 ‚68 
| 190,88 | 83,72 200,64 | 197,64 | Ух? ==672,88 


личин уменьшим каждую варианту комплекса на 20, т. е. вме 
то х; будем оперировать значениями х;—20==х:*, что не пе 
влияет на конечные результаты дисперсионного анализа. Для 
удобства расчетов вспомогательных величин сгруппируем пре 
образованные данные так, чтобы градации фактора А помещг 
лись в верхней части комбинационной таблицы (табл. 59). 
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Переходим к определению девиат. Предварительно найдем 
величину Н==822/12=—=560,33. Затем определяем общую девиа- 
ту: Бу,=хХх?—Н==672,88—560,33==112,55; факториальную де- 
виату: 


р, =. 2 Ех НР. — 560,33 — 580,56 — 560,33 20,23; 


наконец, остаточную девиату: О.=Д, — Эд == 112,55 — 20,23 = 
=92,32. 

Определяем числа степеней свободы. Так как комплекс со- 
держит 12 вариант, число степеней свободы для общей диспер- 
сии Ру=М—1=12—1|==11. Фактор А содержит четыре града- 
ции (три варианта опыта и коитроль); следовательно, число 
степеней свободы для факториальной дисперсии Ёд =а—1== 
==4-——1:==3, Для внутригрупповой, или остаточной, дисперсии 
число степеней свободы №.==А,—№А=11-—3==8 (или Ае=М— 
—0==12—4==8). Проверим правильность расчета: АА--Ё == 
==/А,==3--8==11. Расчет произведен правильно. 

Переходим к определению дисперсий: факториальной $л?== 
=—=Длд/Кд==20,23/3==6,74 и остаточной 5е?==Ре/Ё ==92,32/8 == 
=11,54. Общую дисперсию вычислять нет необходимости, по- 
скольку при выяснении влияния фактора А на результативный 
признак Х используется отношение факториальной дисперсии к 
остаточной дисперсии; общая дисперсия в таком случае приме- 
нения не находит. 

В данном случае оказалось 5л2<5е?. Это означает, что меж- 
групповая вариация не превышает внутригруппового случайно- 
го уровня и, следовательно, считать достоверным влияние фак- 
тора на исследуемый признак нет оснований. С другой сторо- 
ны, обнаруженное соотношение двух дисперсий может вызы- 
вать недоумение, так как по теории должно быть 5422>5е2. Од- 
нако в связи с влиянием случайностей выборок при справед- 
ливости нулевой гипотезы может наблюдаться не только не- 
большое (незначимое) превышение уровня 54? над $5е*, но и 
обратное соотношение, как это обнаружено в рассматриваемом 
примере. С другой стороны, значительное уменьшение 54? по 
сравнению с 5,2 может свидетельствовать о серьезных наруше- 
ниях требований случайностей образования выборок или о дру- 
гих нарушениях условий корректности методики получения 
экспериментальных данных. Какова ситуация в данном случае? 
Если уменьшение 54? по сравнению с 5е? имеет случайный в 
рамках справедливости нулевой гипотезы характер, то приме- 
нение Ё-критерия (Е==5,2/542) должно дать незначимые ре- 
зультаты. Действительно, Ёъ==11,54/6,74= 1,71, что значитель- 
но меньше Ё,;==8,85 для Ёе==8 и Ёл==3. Поэтому можно счи- 
тать, что различия в двух величинах дисперсий отсутствуют и 
проверяемая гнпотеза сохраняется. 
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Пример 2. На одной из опытных станций испытывали урс 
жайность шести местных сортов пшеницы. Опыт проводили Е 
четырехкратной повторности по каждому сорту. Полученные 
результаты приведены в табл. 60. 


Таблица 6: 
Урожай по повторностям, ц/га 

Номера Средний 
сортов 1 2 з | 4 урожай х; 

1 26,1 29,2 30,0 27,3 28,2 

2 25,0 24,3 28,5 29,0 26,7 

3 27,2 26,4 31,0 26,4 27,8 

4 23,6 27,2 25,2 24,8 25,2 

ь 30,0 33,0 36,0 29,8 32,2 


23,0 26,0 26,0 | 24,8 25,0 


Из табл, 60 видно, что на одни и те же условия выращива 
ния различные сорта реагируют по-разному. Подвергнем эте 
данные дисперсному анализу. Как и в предыдущем примере 
чтобы облегчить вычислительную работу, преобразуем дрос- 


Таблица 6 
Сорта пшеннцы (градация фактора 4) 
и 1 А Суммы 
41 30 52 16 80 10| а=6 
72 23 44 52 110 40 
80 25 90 32 140 40 
53 44 28 78 28 
"| 4 | 4 | 4 | 4 | 4 4 |= 
а | 246 | 188 | 230 | г 408 | 1318 
(2х:)? | 60516 | 35344 | зо | төи) 166464 н) 345532 
да | 16074 | 10554 | мет | пе 44184 | 94340 


ные числа следующим образом: каждую варианту комплекс: 
уменьшим на одно и то же число А=22, близкое к Хши==23,С 
Затем полученные разности умножим на К==10, что позволи" 
избавиться от дробей. В результате получим преобразованны+ 


164 


числовые значения результативного признака (26,1—22)10= 
=:41, (25,0—22)10=30, (27,2—22)10=52 и т. д. Переходим к 
засчету вспомогательных величин (табл. 61). 

Рассчитываем суммы квадратов отклонений (девиаты), при- 
-одя их делением на К?==10?=100 к исходным величинам: 


Не. Р ИЕТ 7а аи == 29 
= = (94 340 ) (94 340 — 72880,2) 


24 100 
=21959,8/100—219,598; рен г 


а 72300,2) == (86 383 — 72380,2) —=14002,8/100 = 140,098; 


2е== Юд =219,598—140,028= 79,570. Переходим к определе- 
чию чисел степеней свободы: А,==24—1==23; Ёд==6—1==5 и 
=2=24—6==18. Наконец находим величины факториальной и 
ютаточной дисперсий и сводим результаты дисперсионного ана- 
шиза в заключительную таблицу (табл. 62). 


Таблица 62 
Е ві 
Варьироваиие гаа пены Дисперсия Е, Ф 
5% 1% 
По фактору А 5 140,0 140 _ 28 6,4 28 | 4,2 
Остаточное 18 79,6 4,4 — == = 
Эбщее 23 219,6 — — — — 


Последние графы этой таблицы содержат критические (про- 
центные) точки Ра, которые содержатся в таблице Фишера (см. 
‘абл. УІ Приложений) для двух уровней значимости и чисел 
`тепеней свободы А!==Ад==5 (находят по горизонтали табл. МІ 
Триложений) и Ё›.==А.==18 (находят в первой графе той же 
‘аблицы). Поскольку Ёф> Ё, нулевую гипотезу отвергают на 
Ф-ном уровне значимости (Р<0,01). Следовательно, с вероят- 
тостью более 99% можно заключить, что разница в урожайно- 
ти между сортами не случайна. 

Неравночисленные комплексы. Дисперсионный анализ одно- 
закторных неравномерных комплексов, т. е. комплексов, в гра- 
зациях которых содержатся разные числа вариант х;, принци- 
тиально не отличается от анализа равномерных комплексов. 
‚днако в связи с тем, что групповые среднне неравномерных 
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комплексов имеют разный статистический вес п;, факториаль- 
ную девиату следует вычислять по формуле 


р.=У-2=0-_Н или (112) 
д. 


РА =У(в)-Н; 0,1 (х,—х)]. (113) 
Ј 


Пример 8. Испытывали влияние различных доз минеральных 
удобрений на урожайность озимой ржи. Результаты испытаний 
приведены в табл. 63. 


Таблица 63 
Урожай по повторностям, ц/га 
Дозы занал занак аалда тоа Средний 
удобре- | пр | урожай 
ний, кг/га 1 2 К) 4 5 6 Е7 
15 8,0 8,4 9,0 8,6 4 8,5 
20 8,2 9,0 10,0 10,0 9,2 | 10,0 6 9,4 
25 11,0 13,0 12,0 3 12,0 
30 7,5 8,5 2 8,0 


Здесь результативным признаком Х является урожайность 
ржи, а регулируемым фактором А — дозы удобрений. Фактор А 
имеет четыре градации, т. е. а=4. Подвергнем эти данные дис- 
персионному анализу. Предварительно рассчитаем вспомога- 
тельные величины, построив таблицу таким образом, чтобы гра- 
дации фактора А располагались по вершинам столбцов, а 
значения результативного признака Х распределялись по града- 
циям фактора А (табл. 64). 

Рассчитав вспомогательные величины, переходим к опре- 
делению девиат и чисел степеней свободы: Р,==Ӱх;2— 
—Н == 1384,90 — (142,4)2/15 = 1384,90 — 1351,85 == 33,05; Ба = 


< (Ӯ х;)2 
= Уу н = 1379,16 — 1351,85 = 27,31; р, = р, ра = 


1 
—33,05—27,31=5,74. Ё,=15—1==14; Ёд=4—1==3; А,==15— 
—4==11. 

Находим значения дисперсий:  $42==Од/==27,31/3==9,1; 
5е? ==Ше/==5,74/11==0,52. Дисперсионное отношение Рф== 
==542/52==9,1/0,52= 17,5. Эта величина значительно превышает 
критическую точку Рз:==6,2 для Ёл==3 (находим по горизонтали 
таблицы Фишера), А. ==11 (находим в первом столбце той же 
таблицы) и 1%-ного уровия значимости, что дает основание 
для отвергания нулевой гипотезы. Следовательно, с вероят- 
ностью, большей 99%, можно утверждать, что различия между 
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-рупповыми средними комплекса не являются случайными, они 
зызваны действием испытываемых доз удобрений на урожай 
зимой ржи. 

Применение корреляционных таблиц. Довольно часто, осо- 
зенно в выборках большого объема, отдельные варианты неод- 
тократно повторяются, что позволяет распределять такие вы- 
‚орки в вариационный ряд или в ряд ранжированных значений 
тризиака. В подобных случаях удобной формой группировки 


Таблица 64 
Дозы удобрений (градации фактора А) 
Урожай по Суммы 
повторностям 1 (15) 2 (20) 3 (25) 4 (30) 
д 8,0 8,2 11,0 7,5 а=4 
8,4 9,0 13,0 8,5 
9,0 10,0 12,0 
8,6 10,0 
9,2 
10,0 
п; | | в | 8 |2 | №=15 
У Е о | 56,4 | з о | ю о | 142,4 
(Хҳ:)? | 1156,00 | 3180,96 | 1296,00 | 256,00 | — 
(Хх;)2/пу | 289,00 | 530,16 | 432,00 | 128,00 | 1379,16 
| 289,52 | 532,88 | 434,00 | 128,50 | 1384,90 


ясходных данных, подвергаемых дисперсионному анализу, бу- 
дет корреляционная решетка, образуемая сочетанием строк и 
толбцов, число которых равно числу групп или классов сопря- 
хенных рядов. Классы располагаются в верхней строкеи в 
тервом (слева) столбце корреляционной таблицы; общие часто- 
`ы, обозначаемые символом ѓ,џ, распределяются по ячейкам 
зешетки. 

Классы, или значения признаков, помещаемые в верхней 
троке таблицы, располагаются обычно слева направо в возра- 
:тающем порядке, а в первом столбце таблицы — в убывающем 
орядке, т. е. сверху вниз. При этом промежутки между класса- 
ли могут быть равио- и неравиовеликими. При наличии нерав- 
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комплексов имеют разный статистический вес пз, факториаль- 
ную девиату следует вычислять по формуле 


2. 2 
Уей или (112) 


р.=У(иЯ)-Н; 2,1909 (113) 
7 


Пример 3. Испытывали влияние различных доз минеральных 
удобрений на урожайность озимой ржи. Результаты испытаний 
приведены в табл. 63. 


Таблица 63 
Урожай по повторностям, ц/га 
Дозы Средний 
удобре- т урожай 
ннй, кг/га 1 2 з 4 5 6 7 


Здесь результативным признаком Х является урожайность 
ржи, а регулируемым фактором А — дозы удобрений. Фактор А 
имеет четыре градации, т. е. а==4. Подвергнем эти данные дис- 
персионному анализу. Предварительно рассчитаем вспомога- 
тельные величины, построив таблицу таким образом, чтобы гра- 
дации фактора А располагались по вершинам столбцов, а 
значения результативного признака Х распределялись по града- 
циям фактора А (табл. 64). 

Рассчитав вспомогательные величины, переходим к опре- 
делению девиат и чисел степеней свободы: Д,=Ух?— 
—Н == 1384,90 — (142,4)2/15 = 1384,90 — 1351,85 = 33,05; рл = 


< ©? 
= Ў Н == 1379,16 — 1351,85 = 27,31; р, = р, — Да = 


7 
т Ву=15—1==14; Ра==4—1==3; Ё.==15— 
—4== |1. 

Находим значения дисперсий: 542==Р,/Ед==27,31/8==9,1; 
5е2=Ое/Ё.==5,74/11=0,52. Дисперсионное отношение Ёф== 
==542/5.2==9,1/0,52== 17,5. Эта величина значительно превышает 
критическую точку Р‹:=6,2 для Ёд==3 (находим по горизонтали 
таблицы Фишера), А.=11! (находим в первом столбце той же 
таблицы) и 1%-ного уровия зиачимости, что дает основание 
для отвергания нулевой гипотезы. Следовательно, с вероят- 
ностью, большей 994%, можно утверждать, что различия между 
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Подставляя найдеииые величииы в формулы (114) и (115), 
‚пределяем девиаты: Р,==1384,90— (142,4) 152 1384,90— 
—1351,85==33,05; ВБа== 1379, 161351, 85.07 31; р,.=33,05— 
—27,31==5,74. Получился тот же результат, что и выше. Даль- 
‹ейший ход анализа понятен из предыдущего примера. 

Если межклассовые промежутки рядов Х и Ү одинаковы, де- 
зиаты проще определять по следующим формулам: 


р,= У, (ах) Н; (116) 
2 
Балан (117) 
Лу 
эде н= ОЈ) ; ах — отклонения классов от условиого нуля; 


стальные символы те же, что и в формулах (114) и (115). 


Таблица 66 
Удобрения У, т/га — фактор А 
Урожай Х, Р а, Һа Һа, 
ціга 1 2 з 4 5 х 
20 1 5 6 4 24 96 
19 1 Е 5 4 13 3 39 | 117 
18 2 2 8 4 16 2 32 
17 1 3 5 1 10 1 10 10 
10 2 Е 5 0 0 0 
І | 5 Е | | Е о |а - | 105 | 287 
Ёеуах | 5 | 10 Е Е за | Х(/уах) = 105 
а „у? 2 
(7 =. х) | 50| 1667 | 5780 58.78 | 108,901 >. (727 92" 047,15 
у Ли 


Пример 5. Испытывали влияние различиых доз вносимых в 
почву оргаиических удобрений иа урожай пшеиицы. Получеи- 
ные результаты и их обработка приведеиы в табл. 66. 

Как и в предыдущем примере, крылья этой таблицы служат 
для вычисления вспомогательиых величин. Подставляя эти ве- 
личины в формулы (116) и (117), находим: Р,==287—1052/50 == 
=287-—220,50==66,50; Рд==247,15—220,50=26,55; Ш.==66,50— 
—26,65 =39,85. Определяем числа степеией свободы: Ау==50— 
—1=49; Ад=5—]==4; Ё. =50-—5==45. Находим зиачеиия дис- 
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персий: 542==26,65/4= 6,66; 5.?==39,85/45 ==0,89. Отсюда Ёф== 
= 6,66/0,89==7,5>Р.‚=3,76 для Кд=4, К==45 и а==0,01 (см. 
табл. ҮІ Приложений). Нулевая гипотеза отвергается на высо- 
ком уровне значимости (Р<0,01). 

Ранговый анализ. Равночисленные (по объему) 
комплексы. Правильное применение дисперсионного анализа 
основано на предположении о нормальном распределении сово- 
купностей, из которых извлечены выборки, входящие в диспер- 
сионный комплекс. Если это условие не выполняется или о ха- 
рактере распределения нет сведений, применяют непараметри- 
ческие методы анализа. Этот метод не требует, чтобы исходные 
данные были представлены абсолютными величинами; здесь 
допустимо использование относительных величин. 

Метод основан на сравнении сумм рангов в градациях дис- 
персионного комплекса. Исходные данные ранжируют, т. е. рас- 
полагают (в пределах градаций) в ряд по возрастающим зна- 
чениям признака. Затем каждому значению признака присваи- 
вают порядковый номер, его ранг. (Понятие ранжирования уже 
было описано в гл. У, например применение ранговых крите- 
риев, в частности О-критерия Уилкоксона.) 

При наличии равномерных дисперсионных комплексов ран- 
говый анализ проводят с помощью критерия Фридмана по 


формуле 


2 __125(3 А)? _ 

ХА ТЕЧЕ Зп (24 1), (118) 
где УР№;-— сумма рангов в каждой градации; п — численность 
вариант в каждой градации; а— число градаций. Полученное 
значение у? сравнивают с критическим значением этого крите- 
рия по табл. ХІХ Приложений в случаях, когда а=3 и 2<и=< 
—<9 или а=4 и 2<п=54. При больших значениях а и пур2-ҳ? 
и можно сравнивать ҳ2аф с критическими значениями по 
табл. УП Приложений для принятого уровня значимости а и 
числа степеней свободы &=а—1. Н, — гипотеза, или предполо- 
жение о том, что суммы рангов в градациях равны, а их разли- 
чия случайны, отвергается, если у?2р>>2,. 

Пример 6. В трех разновозрастных группах детей со здоро- 
выми зубами определяли гигиенический индекс (ГИ), выражае- 
мый в условных единицах. Полученные результаты и их обра- 
ботка приведены в табл. 67. 

Как видно из данных табл. 67, значения ГИ ранжируются 
по пробам (по строкам), а ранги суммируются по градациям 
(по столбцам). Например, ранжируем величину ГИ в первой 
строке: наименьшей величине ГИ==1 (3 года) соответствует 
ранг, равный единице, а одинаковым значениям ГИ в 4 и 5 лет 
соответствуют и одинаковые ранги (2-13) /2==2,5, Сумма рангов 
комплекса должна быть равна па(а-+1)/2, т. е. в данном прн- 


170 


мере 6-3.4/2=36. Сумма рангов комплекса ХУ (ХА;) =8,5+ 124 
+ 15,5=36. 
Следовательно, расчеты произведены правильно. Теперь по 


формуле (118) вычислим ас ВВА еа 


6.3.4 
=—76,08—72==4,08. 

По табл. ХІХ Приложений для «=0,05, п==6 и а==3 находим 
25:==7,00. Так как эта величина превосходит фактически полу- 
ченное значение критерия Фридмана (4,08), то Но-гипотеза 
сохраняется. Таким образом, разница в гигиеническом индексе 
у детей разного возраста оказалась в приведенном примере не- 
достоверной. 


Таблица 67 
Возраст детей, лет 
К) 4 5 
Пробы 

А, Е: Аз Р, Аз В: 
1 1,0 1 3,0 2,5 3,0 2,5 
2 1,0 1 1,2 2 1,3 3 
3 1,0 1 2,0 2 2,2 3 
4 1,0 1,5 1,0 1,5 1,2 3 
5 2,6 2 2,7 3 1,3 1 
6 27 2 1,3 1 3,0 3 

Суммы УА=8,5 2К.==12 ХКз==15,5 


Неравночисленные комплексы. Если в градациях 
дисперсионного комплекса число вариант не одинаково (неорто- 
гональный комплекс), то при обработке собранных данных сле- 
дует использовать непараметрический критерий Краскелла — 
Уоллиса 

И Ве Уу -ЁА _з(м+1), (119) 

ММ+1) т; 
где № — общее число наблюдений, объем комплекса; №; — чис- 
ленность вариант в отдельных градациях комплекса; А; — ранги 
вариант, ранжированных в общем порядке, т. е. не по отдель- 
ным градациям, как в предыдущем примере, а путем располо- 
жения всех вариант комплекса в один общий ряд (см. ниже). 

Условием для отвергания нулевой гипотезы на принятом 
уровне значимости а будет Нъ>> Н,:. Последняя величина нахо- 
дится в табл. ХХ Приложений. При а>3 или п>5 Н-»2, по- 
этому величину Нф можно сравнивать с табличным значением 
х2. (см. табл. УП Приложений). Но-гипотезу отвергают, если 
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Нь? для прииятого уровня значимости (а) и числа степе 
ней свободы (4) =а—1. 

Пример 7. Изучали глазо-сердечный рефлекс (рефлекс Да 
нини — Ашнера) у детей дошкольного и школьного возрасте 
Нужно было выяснить, существуют ли различия между этимұ 
группами детей по длительности латентного периода исследуе- 
мого рефлекса. Изучение проводили методом прикосновения 
(пальцем) к глазному яблоку с последующей регистрацией вре 
мени наступления сердечного рефлекса. Результаты исследова 
ния приведены в табл. 68. 


Таблица 6: 
Длительность латентного периода, с 
Возраст, 
Рт <05 | А | 05 ГА 2 ГА 4 77 
1—2 12 16 7 10 2 3,5 1 1,5 
3—4 9 13 5 8 4 6,5 1 1,5 
5—6 11 15 8 11,5 3 5 2 3,5 
7—8 8 11,5 6 9 4 6,5 
9—10 10 14 
Сумма 3 44 5 55 4 24 4 13 


В этой таблице 16 вариант, которые варьируют в предела: 
от 1 до 12 с. Расположим все варианты по возрастающим значе- 
ниям в один общий ряд и определим их ранги. Если бы отдель- 
ные варианты не повторялись, их рангами были бы соответст 
вующие порядковые числа от 1 до 12. При наличии в выборк: 
повторяющихся вариант им присваивают одинаковые рангі 
при этом ряд последовательных значений признака удлнняется 
В данном примере это выглядит следующим образом: 


Номера 

вариант 12345 6 7 8910 П 1213 14 15 16 
= 11223446567 8 89101! 12 
Кз= 1,5 1,5 3,5 3,5 5 6,5 6,5 8 91011,511,513 14 15 16 


Проделав эту операцию, помещаем рангн на присущие их 
места в градациях комплекса. Так, в первом столбце табл. 6 
три варианты: 12, 9 и 11. Им соответствуют ранги 16, 13, 18 
сумма этих рангов равна 44. Определив таким образом сумме 
рангов для каждой градации комплекса в отдельности, подстав 
ляем известные величины в формулу (119): 


ЕЕ ИЕ Е сЕ Зы: 
и | разг И 


16.17\ 3 4 
==22-(645,88-605,00-- 144,00 4-49,00)— 51 == 1443,33 —-51 = 
— 19,68, 
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Известно, что при а>3 или п>5 Н-»+х?2!, Поэтому величину 
1ф можно сравнивать с табличным значением у2,; (см. табл. УП 
Лриложений). Но-гипотезу отвергают, если Нфі>%?.:. В данном 
примере а>3 и п==5. В табл. УП Приложений для &=а—1= 
=4—1|=3З и 1%-ного уровня значимости находим %2,:= 11,34. 
Эта величина меньше фактически получеиной Нф= 12,68. Сле- 
зовательно, с вероятностью Р>99%ф можио утверждать, что 
лежду детьми дошкольного и школьного возраста существуют 
эазличия в скорости протекания глазо-сердечного рефлекса. 


Таблица 69 
Возраст, лет 
3 4 5 
Пробы 
А, Р, Аз А, Аз К 
1 2 3 3 9,5 2 3 
2 3 9,5 3 9,5 2 3 
3 3 9,5 3 9,5 2 3 
4 3 9,5 3 9,5 2 3 
5 3 9,5 4 14 — — 
Суммы УВ, =41 УХЮ=52 УЮ:=12 


Когда дисперсионные комплексы имеют не больше трех гра- 
заций, т. е. при а==3 с числом вариант в градациях п<5, оцен- 
:у достоверности фактически полученной величины Нъ произво- 
4ят по специальным таблицам критических значений критерия 
Т (см. табл. ХХ Приложений). 

Пример 8. В трех разновозрастных группах детей со .здоро- 
зыми зубами был проведен тест резистентности эмали (ТЭР- 
ест). Величины ТЭР-индекса выражаются в баллах и могут 
‹олебаться от 1 до 4. Результаты исследования сведены в 
‘абл. 69. В этой таблице содержится 14 вариант, которые варьи- 
эуют в пределах от 2 до 4. 

Как и в предыдущем примере, определяем ранги вариант 
‘ледующим образом: 


х 2222233333333 4 
К; З3 З З З З 9,5 9,5 9,5 9,5 95 9,5 9,5 9,5 14 


Затем находим суммы рангов членов ряда для каждой груп- 
ты в отдельности. Подставляем известные величины в форму- 


1 См.: Терентьев П. В., Ростова Н. С. Практикум по биометрии. Л., 1977. 
1. 116—117, 150, 
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лу (119): 
№ 
14.15 


(2-02) ви 46-6 455577. 
5 5 4 14.15 

Так как в данном примере а=3 и п%5, то необходимо вос- 
пользоваться табл. ХХ Приложений. Находим для п1==5, пз==5, 
Пз==4 критические значения: при а=0,05 Н,;==5,66 и при а= 
=0,01 Н,:==7,79. Сравнивая эти величины с Нф=7,17, заклю- 
чаем, что Но-гипотеза отвергается на 5%-ном уровне значимо- 
сти (0,01<Р< 0,05). Таким образом, установлено, что кислотная 
резистентность здоровых зубов в обследованных группах детей 
с возрастом достоверно изменяется. 

Оценка силы влияиия факторов. Метод Плохинского. 
После того как достоверно установлено действие регулируемого 
фактора, можно измерить силу его влияния на результативный 
признак. Последнюю определяют как долю межгрупповой ва- 
риации в общем варьировании результативного признака. Для 
измерения силы влияния предложено несколько методов. Наи- 
большее признание получили методы Плохинского (1966, 1970) 
и Снедекора (1961). Метод Плохинского базируется на равен- 
стве девиат Р,=0О,--Дь, которое осуществляется в любом дис- 
персионном комплексе. Показатель силы влияния, обозначае- 
мый символом йћ,?, строят следующим образом: все члены ука- 
занного равенства делят на Оу, что дает 


НВ 
р, Бу 
Отсюда вычисляют показатель силы влияния: 
р 2 р 
о - или Йа. 20 
р; х р, (120) 


Критерием достоверности этого показателя служит его отно- 
шение к своей ошибке, которую определяют по следующей при- 
ближенной формуле: 


—1 
зы = (1-е, (121) 


где а— число градаций регулируемого фактора; № — объем дис- 

персионного комплекса. Нулевую гипотезу отвергают, если Ё== 

==й,?/5, 222 Е, для принятого уровня значимости а и чисел сте- 
х 


пеней свободы &=а-—1 (находится в верхней строке табл. У 
Приложений) и 2 =М№М—а (находится в первом столбце той же 
таблицы). 

Пример 9. Определить силу влияния сорта на урожайность 
пшеницы. Исходные данные; 0,==219,60; а= 140,03; $42==28,0; 
5е?==4,4; п==4 (см. табл. 61 и 62). Отсюда сила влияния сорта 
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(фактор А) на урожайность пшеницы (результативный при- 
знак Х) выражается следующей величиной: 


д —_2А — 140,03 0.638, или 63,9%. 
Ру 219,50 


Это означает, что примерно около 64% от общего варьирова- 
ния признака Х обусловлено природой сорта, его генетическим 
разнообразием и около 36% приходится на долю воздействую- 
щих на признак других (модифицирующих) факторов. 

Метод Снедекора. В отличие от метода Плохинского 
этот метод основан на применении не девиат, а дисперсий, при- 
чем показатель силы влияния строят с учетом действия на при- 
знак не только регулируемых, но и нерегулируемых в опыте 
факторов, оценкой которых служит внутригрупповая диспер- 
сия, т. е. 

а 
о, (122) 
5, +56 

где $х2== (5х2—5е?)/п — «исправленная» межгрупповая диспер- 
сия, равная разности между дисперсиями межгрупповой (неис- 
правленной) и внутригрупповой, или остаточной, отнесенной к 
числу членов п в градациях комплекса. Если комплекс неравно- 
мерный, величнну п определяют по формуле 


п (М0) (123) 


где а — число градаций регулируемого фактора; п — численность 
вариант х; в отдельных градациях фактора; №= 2л — общее 
число вариант, или объем комплекса. 

Формулу (122) можно преобразовать таким образом, чтобы 
при вычислении показателя силы влияния й,? не прибегать к 
«исправлению» межгрупповой дисперсии: 


2 а _ ия 
а а а (124) 
($: —5е)/т + 52 55 — 5, + 5 


Очень удобной при определении величины й,? является фор- 
мула 
2 2 
9 5, — 5 
и, (125) 
5. (0 —– 1) 5, 

Достоверность оценок силы влияния, определяемых по мето- 
ду Снедекора, устанавливают обычным в дисперсионном анали- 
зе способом — посредством Р-критерия Фишера (Е=5,2/52). 
Величину Е-критерия сравнивают с критическим значением это- 
го показателя для принятого уровня значимости а и чисел сте. 
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пеней свободы №; и ё, причем последние определяют так же, 
как и при оценке критерия Плохинского. 

Пример да. Определить силу влияния сорта на урожайность 
пшеницы по методу Снедекора. Необходимые исходные данные 
приведены в примере 9: 


29044 28.6 0.573, или 57,32%. 
28,0 4- (4—1) 4,4 41,2 

Нетрудно заметить, что показатель силы влияния, опреде- 
ленный по методу Плохинского (йл?==0,638), оказался больше, 
чем тот же показатель, вычисленный по методу Снедекора 
(Пл? ==0,573). Это не случайное явление: как правило, определе- 
ние показателя силы влияния по Плохинскому и по Снедекору 
не приводит к идентичному результату. Поэтому при определе- 
нии силы влияния следует указывать, каким методом вычислен 
этот показатель !. | 

Достоверность оценок силы влияния йлд?==0,638 (по Плохин- 
скому) и й42==0,573 (по Снедекору) устанавливают следующим 
образом: по Плохинскому, д? из, .—=0,638/0,101==6,32, где 50 — 


ошибка показателя силы влияния, определяемая по формуле 
(121). По Снедекору, Еф==5л?/5е?==28,0/4,4=6,36. В обоих слу- 
чаях Р:‚==4,25 для и ==а—1==6—1==5; Ёо = №——а==94—6=18 и 
0==0,1%. Нулевую гипотезу отвергают иа высоком уровне зиа- 
чимости (Р<0,001). Это означает, что в данном случае оценки 
хорошо репрезентируют генеральные параметры и вполне до- 
стоверны. 

Пример 10. В табл. 63 приведены данные о влиянии различ- 
ных доз минеральных удобрений на урожай озимой ржи. В дан- 
ном случае представлен неравномерный дисперсионный комп- 
лекс с его характеристиками: Р,=33,05; Да=27,31; 54? ==9,10; 
5е?=0,52; п=4; М==15. Из-за рассматриваемой неравномерно- 
сти комплекса необходимо рассчитать усредненное значение й 
по формуле (123): 
вет (56) 69—35 

4—1 - 15 3 15 3 


Отсюда, по Снедекору, 96 ЕВА ОА =—0,82; 


Переходим к определению критерия достоверности оцеиок 
(по Фишеру): 
1 Известно, что показатель силы влияния фактора, найденный по методу 


Плохинского, оказывается весьма смещенной оценкой. Поэтому лучше поль- 
зоваться аналогичным показателем Снедекора, (Прим. ред.) 
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цо Снедекору, Ёр =5%/5+==9,10/0,52 =17,5; 
по Плохинскому, Вуз Наза —0,83/0,05 = 16,6. 


і 

‚ Оба показателя значительно превосходят критическую точку 
Е,,=6,22 для ==4—1==3 (находим по горизонтали табл. УІ 
Приложений), &›=15—4==11 (находим в первом столбце упо- 
мянутой таблицы) н уровня значимости а==0,1%. Так как 
Еъ> Е, нулевая гипотеза опровергается на высоком уровне 
значимости (Р <0,001). Таким образом, доказано, что различ- 
ные дозы минеральных удобрений по-разному влияют на уро- 
жай озимой ржи. 

Сравнение групповых средних дисперсионного комплекса. 
После того как достоверно установлено влияние регулируемого 
фактора или факторов на результативный признак, при необхо- 
димости прибегают к сравнению групповых средних друг с дру- 
гом или с какой-либо другой величиной, например с контролем, 
стандартом, установленной нормой ит. п. 

Разность между средними величинами, как описано выше, 
оценивают по {-критерию Стьюдента, т. е. по отношению ука: 
занной разности к ее ошибке. Этот способ, однако, неприменим 
к сравнительной оценке средних в дисперсионном комплексе, 
так как наряду с межгрупповой дисперсией на величине ошибки 
разности $4 между групповыми средними комплекса сказывает- 
ся и влияние внутригрупповой дисперсии ѕ,?, величина которой 
зависит и от численности вариант х; в группах, и от количества 
групп а, входящих в данный комплекс. Эти обстоятельства 
ограничивают применение критериев Стьюдента и Фишера. По- 
этому в качестве ошибки разности между групповыми средними 
дисперсионного комплекса принят корень квадратный из отно- 
шения внутригрупповой, или остаточной, дисперсии к числу 
вариант, входящих в состав градаций фактора А, т. е. 


= 
„= —=. (126) 


Для оценки разности между групповыми средними диспер- 
сионного комплекса применяют специальные методы, созданные 
на базе критериев Стьюдента и Фишера. Из них наиболее под- 
ходящими считают методы множественных сравнений, разра- 
ботанные Дж. Тьюки (1949) и Г. Шеффе (1953). 

Метод Тьюки. Этот метод применяют для проверки нуле- 
вой гипотезы при сравнении групповых средних &; и Х› равно- 
великих групп, т. е. при п! ==п2==и. Критерием оценки служит 
отношение разности сравниваемых средних к своей ошибке: 


рае 14 
У 
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Величину ѓо сравиивают с критической точкой ©! для Ё, и 5%: 
ного уровня значимости с учетом числа групп или градаций д 
регулируемого фактора А. Критические значения @.: содержат» 
ся в табл. ХХГУ Приложений. Нулевую гипотезу отвергают, 
если ѓо2> 0: или |#1—:| >54 Оз. 

Пример 11. В табл. 60 приведены групповые средние, харак- 
теризующие урожайность шести сортов пшеницы в местных ус- 
ловиях возделывания этой культуры. Из этнх данных видно, что’ 
наиболее урожайным оказался пятый сорт (х5==32,2 ц/га), а 
наименее урожайным — шестой сорт (26=25,0 ц/га). Если в ка- 
честве стандарта условно принять урожайность шестого сорта, 
то разница по урожайности между пятым и шестым сортами 
пшеницы составит 32,2—25,0=7,2 ц/га. 

Проверим достоверность этой разности. Здесь средние вы- 
числены на равных по объему группах вариант (п=4); число 
испытываемых сортов равно шести, т. е. а==6; объем комплекса 
№24; внутригрупповая дисперсия 524,4. Отсюда 


32,2 — 25,0 Е. 


= —6,86. 
и 4,4 1,05. 
4 


В табл. ХХГУ Приложений для &,== №А—0==24—6=18 и а=6 
находим (@,:=4,5. Так как ѓіо> 0, нулевую гипотезу отвергают 
на 5%-ном уровне значимости. Разницу между сравниваемыми 
средними дисперсионного комплекса следует признать статисти- 
чески достоверной. 

Метод Шеффе. В отличие от метода Тьюки этот метод 
множествениых сравнений одинаково применим и к равно-, и к 
неравновеликим по составу группам. Критерием достоверности 
различий, наблюдаемых между групповыми средними диспер- 
сионного комплекса, служат следующие отношения: 


РЕ с 
== — и = (при п1 =); 


ѓо = 


Е == р! — ЕЛ па _ 23 
ү Ета (при л, 4 т). 


Нулевую гипотезу отвергают, если Ё > И (а — ПБ, где а — 
число градаций фактора А; Е,; определяют с помощью таблицы 
Фишера (табл. УІ Приложений) для принятого уровня значи- 
мости а и чисел степеней свободы А=а—1 и Ё = №-а, где М— 
объем дисперсионного комплекса. 

Пример 12. В табл. 63 приведены данные о влиянии различ- 
ных доз минеральных удобрений на урожай озимой ржи. В той 
же таблице содержатся групповые средние, характеризующие 
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зависимость урожая ржи от внесения в почву различных доз 
удобрений. Из результатов видно, что более высокий урожай 
ржи (12,0 ц/га) получен при внесении удобрений в количестве 
25 кг/га. Сравним эту величину с урожаем данной культуры 
р ц/га), полученным при внесении в почву 20 кг/га удобре- 
ний. 

В данном случае здесь представлен неравномериый комп- 
лекс: средняя Х:==9,4 рассчитана по шести, а средняя з= 
== 12,0 — по трем измерениям. Число групп, входящих в комп- 
лекс, равно четырем, т. е. а==4; объем комплекса М==15; внут- 
ригрупповая дисперсия оказалась равной 5,2 == 0,52, Отсюда 


Е. = а , піл Е 12,0 — 9,4 3.6 
у И и — 05 И 3 
Уз 1 2 , 


Для А=а—1==4—1=:3; Ё.== М№-а==15—4==11 и 19-ного 
уровня значимости в табл. УІ Приложений находим Ё,==6,2. 


Отсюда Ё,,=[/ (4 — 1)6,2=/ 18,64,31. Таким образом, 
Еъ> Е, что позволяет отвергиуть нулевую гипотезу на высоком 
уровне значимости (Р< 0,01). 

Рассмотренный метод Шеффе выгодно отличается от метода 
Тьюки, поскольку последний неприменим к оценке групповых 
средних дисперсионного комплекса, вычисленных на разных 
объемах групп. Однако при сравнении средних &; и Х› равнове- 
ликих групп предпочтение следует отдавать методу Тьюки. 


У!.2. АНАЛИЗ ДВУХФАКТОРНЫХ КОМПЛЕКСОВ 


Ортогональные комплексы. Приступая к рассмотрению двух- 
факторных равномерных и пропорциональных комплексов, сле- 
дует заметить, что при их образоваиии, как и вообще при обра- 
зовании многофакторных комплексов, иеобходимо, чтобы регули- 
руемые факторы были независимы друг от друга. Выполнение 
этого требования — независимости факторов — одно из важней- 
ших условий правильного применения дисперсионного анализа. 
Нельзя подвергать дисперсионному аналнзу корреляционно свя- 
занные признаки, такие, например, как масса тела и его ли- 
нейные размеры ит. п. 

Общие схемы дисперсионного анализа двухфакторных орто- 
гональных комплексов в принципе не отличаются от описаниых 
выше схем однофакторного дисперсионного анализа. Анализ 
двухфакторных комплексов не меняет, а лишь несколько услож- 
няет общие схемы, поскольку наряду с действием каждого 
фактора в отдельности приходится учитывать и их совместное 
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действие на результативный признак. Так, изучая два регули- 
руемых фактора А и В, можно влияние на результативный при- 
знак из прочих факторов изобразить в виде следующей схемы: 


Сочетание 
факторов 
АВ 


Результативный 


Фактор 
признак 


Из этой схемы следует, что общая сумма квадратов отклонений 
Р, содержит четыре компонента варьирования: Р,=рл+Ррв+ 
+Рлв+рг, а общая факториальная сумма квадратов отклоне- 
ний Ох состоит из трех компонентов: О,=Ра+ Рв+ Рав. 

Если учитывать не два, а три регулируемых фактора А, В 
и С, то наряду с их индивидуальным действием возможно влия- 
ние на признак трех попарных сочетаний (АВ, АС, ВС), их 
совместное действие (АВС), а также влияние неорганизованных 
(случайных) факторов. Таким образом, общий компонент варьи- 
рования будет содержать восемь элементов: 


Р, =р0, -Рв+0с + Рав+ Рас Рвс+ Равс+2Р,. 


При большем числе учитываемых факторов число их воз- 
можных сочетаний будет еще больше. В изучении влияния на 
результативный признак всех учитываемых факторов и их воз- 
можных комбинаций и заключается основная задача дисперси- 
онного анализа. При этом не всегда необходимо учитывать все 
возможные сочетания организованных факторов. Этот вопрос 
исследователь решает в зависимости от цели исследования и 
принятой полноты дисперсионного анализа. 

Дисперсионный анализ двухфакторных ортогональных комп- 
лексов проводят по следующей примерной схеме. 

1. Рассчитывают девиаты (как и при обработке однофактор- 
ных комплексов): общую для всего комплекса Д,, межгруппо- 
вую 0, и остаточную Р.. Для этого служат формулы (109), 


(110) и (111), причем р,=2 0 н. 
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2. Затем определяют факториальные девиаты: 
а 


2 
ры НЕ (127) 
ПА 
о 2 
х 
РКО та (128) 
Пв 


3. Анализ двухфакторных пропорциональных комплексов 
тоже начинается с определения девиат (общей, межгрупповой и 
остаточной) по указанным выше формулам (109), (110) и 
(111), причем при определении Р, формула (110) выглядит 
так: 


о: (#12 _ 
р,=У РЕЙ 
Факториальные девиаты определяют по следующим форму- 
лам: 
а х 2 , 
р.=У ха) 22. Нн: 


(199) 


1=1 А 
Б 2 
а= У в) н, (130) 
пар В 


Девиату совместного действия факторов в обоих случаях опре- 
деляют по формуле 


Рав=Р0,-— (0р +Р»). (131) 


Как и в предыдущих случаях, в этих формулах повторяется 
величина Н= (Хх;)?/М№, где х; — варианты, входящие в состав 
дисперсионного комплекса; № Ўп==паб — общая численность 
вариант, или объем комплекса; а — число градаций фактора А; 
б — число градаций фактора В; п — количество вариант в от- 
дельных градациях комплекса; пл=иф — общая численность 
вариант в каждой градации фактора А; пв==па — общая чис- 
ленность вариант в каждой градации фактора В; Ў ха — сумма 
вариант в градациях фактора А; Ўхв —сумма вариант в града: 
циях фактора В. 

4. Определив значения девиат, переходят к установлению 
чисел степеней свободы, которые равны: &,=Мр—1 для общей 
дисперсии; к, =а0—1 для межгрупповой дисперсии, характери- 
зующей влияние обоих факторов А и В на результативный при- 
знак Х; Ё.=М—а6 для внутригрупповой, или остаточной, дис- 
персии; Кд=а—1 для факториальной дисперсии А; Ев=0—1 
для факториальной дисперсии В; Клв= (0—1) (6—1) = Кав для 
дисперсии совместного действия факторов Ди В. 
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При этом, как и в предыдущих случаях, числа степеней све 
боды должны находиться в таких же количественных соотноше- 
ниях, как и соответствующие девиаты, т. е. Ру=ра+Рвт 
+Рав+ р. и соответственно у= Ёа Рв Кав--ке. Равенств" 
Р,=рҳ+Рв+ Рав должно соответствовать равенство Ё;==Ёа-т 
+ Ёв+- Кав, а равенству О,==Р,+ Р, — равенство Ёу==Ах--Ке. Эте 
равенства могут служить для проверки правильности расчете 
девиат и чисел степеней свободы. 


Таблица 71 
Вариация Ков" та Девиаты Дисперсии а це "отноше. 
ния 
2 Ва 
По фактору А а—1 РА 5д = ЕЕ 542/52 
2 _ 2а 
По фактору В 5—1 Рв 5в == а 587/52 
Совместно АВ (а—1) (6—1) Рав В = 5 дв/52 
= –”дв 
(а — 1) (6 — 1) 
р 
Остаточная Маһ Р, > = 


Зе М — а 
Общая М—1 Ру — — 


5. Отнесением девиат к соответствующим числам степенег 
свободы определяют значения дисперсий, а по их отношения» 
к величине остаточной дисперсии устанавливают дисперсионныє 
отношения Ё, которые сравнивают с критическими точкамЕ 
Е, для соответствующих чисел степеней свободы и принимає 
мого уровня значимости а. Но-гипотезу отвергают, если Ёф-–- 
>Ра. 

Заключительным этапом дисперсионного анализа является 
сведение результатов в таблицу, которая содержит следующие 
показатели (табл. 70). 

Эта таблица одновременно служит и схемой двухфакторног‹ 
дисперсионного анализа. Обычно к ней добавляют еще две 
столбца, в которых приводят критические точки дисперсионног‹ 
отношения Ё; для 5ф-ного и 1%-ного уровней значимости Е 
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‘оответствующих чисел степеней свободы, что облегчает выво- 
ҳы относительно проверки нулевой гипотезы. 

Пример 18. Испытывали влияние трех видов микроэлементов 
ча жирномолочность коров. Эксперимент проводили на четырех 


Таблица 71 
Процент жира в молоке при трехкратных пробах 
{градации фактора А) Группо- 
Группы А —————————————__———| вые сред- 
коров В нне Хр 


| 
| 
| 


Таблица 72 
Градации Варианты х; 
2х, (Хх)? хр 

А В 1 2 3 
В! 21 20 34 75 5 625 1997 
А Вз 40 32 41 113 12 769 4 305 
1 Вз 30 28 27 85 7 225 2413 
| В, 34 30 29 93 8 649 2 897 
В! 28 | 26 30 84 7 056 2360 
А В, 39 41 45 125 15 625 5227 
Е Вз 35 40 28 103 10 609 3 609 
В, 30 29 30 89 7 921 2641 
В: 24 21 28 73 5329 1801 
А В, 30 39 42 11 12 321 4 185 
а Вз 48 31 29 108 11 664 4 106 
В, 33 28 30 91 8281 2773 
Сумма — — — 1150 113074 | 38314 


`руппах одновозрастных животных различных пород. Каждое 
леспытание имело трехкратную повторность. Полученные резуль- 
“аты приведены в табл. 71. 

Здесь через А обозначен фактор воздействия, т. е. микроэле- 
тенты, а через В группы коров различных пород. Число гра- 
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даций фактора А равно трем, т. е. а==3, а число групп фактора 
В равно четырем, т. е. $==4. Видно, что групповые средние Ха 
варьируют по своей величине как для группы коров, так и по 
градациям фактора А. Необходимо выяснить, случайны или до- 
стоверны различия, наблюдаемые между грунповыми средними. 

Чтобы облегчить обработку этих данных, прежде всего из- 
бавимся от дробей, увеличив каждую варианту комплекса в 
К==10 раз. Затем сгруппируем выборку так, чтобы градации 
фактора А и подразделения или группы фактора В располага- 
лись по строкам комбинационной таблицы (можно распреде- 
лять их и по столбцам таблицы), что облегчит расчет вспомо- 
гательных величин, необходимых для определения девиат Ду, 
Р, ир., а затем и расчет других (факториальных) девиат. Та- 
кая группировка данных и расчет Ухь, (Хх)? и Хх приведены 
в табл. 72. 

Для определения общих девиат Ду, О, и О. в двухфактор- 
иом равномерном комплексе применим формулы (109), (110) и 
(111), уменьшая результаты расчетов в К?==100 раз (так как 
каждая варианта комплекса была увеличена в К==10 раз): 


2 Н-==1 [38.314 — 150) 1 (38.314— 36. ЕА 
Р,=У ж? = о (88 34—15 ) = (38:314—36.736,1) 
1877,9__ : 201502 _ ЕЖЕ 118.0,74 = Е 
2 100 57855 100 М т 3 н)= 
==_1 (37. 22861 — 955,2 955. р 
— 5 87-691,3— 36-7361) 5%" 9,55; Р, 


=:15,78 — 9,55 =6,23. 

Определяем числа степеней свободы: Ё,=36—1==35; Ёх== 
==06—1=3.4—1==11; А.==М№М-—@6==36—12=24. Находим дис- 
персии: 5,2:==9,55/11=0,87 и 5е?==6,23/24==0,26. Отсюда Ёф== 
==0,87/0,26 =3,35. В табл. УГ Приложений для 1%-ного уровня 
значимости и чисел степеней свободы Ё;==11 и Ё,==24 находим 
Е ==3,1. Так как Ез>Ёзь, нулевая гипотеза отвергается на вы- 
соком уровне значимости (Р< 0,01). 

Переходим к расчету факториальных девиат. Предваритель- 
ио вычислим У (Ўха)? и Х(Ухв) (табл. 73). Напомним, что п==3, 
а=3 и $=4. Отсюда па=пр =3:4=12 и пв=па=3.3=9, Тогда 


1 [441446 1 5 511 А 
Рд= к ( = н) 227 (86787,3 —36736,1)= 22 = 0,51; 
в (08 Н) 105087580.0— 36736,1)-= 9087,0; 
100 9 100 100 


Рав==р,(ра-+ Рв) =9,55—0,51 +7,94=1,10. Проверим правиль- 
ность расчета девиат: Р,==Ӣра+Рв+ Рлв+ре==0,514-7,94+ 
+1,1046,23= 15,78, Расчет произведен правильно. 

Определяем числа степеней свободы: Ёу== М—1:=36—1-=35; 
Ва==0—1==3—1==9; Юв==0——1==4——1:=-=3; Ёав==аЁв==2.3==6 и 
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„==М-—06==36—12==24, Проверяем правильность расчета чисел 
тепеней свободы: Ёу== а-в Ёдв-+ №==2+3-+6--24==35. Рас- 
тет произведен правильно. * | 


Таблица 73 
Расчет д | (яд)? | Расчет Ххв | (5х в)? 
75--1134-854-93 = 366 133956 75484-73 =232 53824 
84-125--103-89 =401 160801 1134125 И =349 121801 
73--1114-108-91 =383 146689 85--103--108 ==296 87616 
93-89-91 =273 74529 
Сумма — | 441446 | Сумма — | 337770 


Относим девиаты к соответствующим числам степеней сво- 
юды и находим значения дисперсий. Затем определяем диспер- 
‘ионные отношения факториальных дисперсий к дисперсии 
‚статочной Ёф, которые сравниваем с критическими точками 
7% Результаты дисперсионного анализа сводим в заключитель- 


{ую таблицу (табл. 74). Ея т 
аблица 


Степени Диспер- Р 


Вариация свободы | Девиаты син 


По фактору А 2 0,51 0,26 1,0 | 3,4 5,6 
По фактору В 3 7,94 2,65 10,2 | 3,0 4,7 
Совместно АВ 6 1,10 0,18 1,4 | 3,8 7,3 
Остаточная 24 6,23 0,26 — — — 
Общая 35 15,78 — — — — 


Из табл. 74 видно, что нулевая гипотеза опровергается толь- 
хо в отношении фактора В, действие которого на признак ока- 
‹алось в высшей степени достоверным (Р<0,01), Это означает, 
то жирномолочность коров связана со свойствами их породы, 
“. е. контролируется наследственностью и не зависит от влияния 
ла этот признак испытываемых препаратов микроэлементов. 
Зидимо, поэтому и взаимодействие факторов АВ существенно не 
‘казалось на величине результативного признака. 

Пример 14. В одном из опытных хозяйств испытывали уро- 
хайность разных сортов крыжовника и их устойчивость против 
зредоносного действия крыжовникового пилильщика, Получён- 
чые результаты приведены в табл. 75. Из этой таблицы видно, 
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что испытываемые сорта крыжовника обладают разной устои- 
чивостью к поражаемости растений пилильщиком и что незг 
висимо от сортовой принадлежности растений этот вредител: 
снижает урожай плодов этой культуры. Чтобы установить, дс 
стоверны илн случайны различия, наблюдаемые между группе 
выми средними, подвергнем эти данные дисперсионному аналр- 
зу. Как и в предыдущем примере, сгруппируем выборку Е 


Таблица 7: 
Сорта крыжовиика А 
Собрано плодов Английский желтый А; Малахитовый Аз 
с отдельных кустов 
крыжовннка, кг Ххв 
средний средиий 


наблюдения |урожай х, | Наблюдения |урожай х, 


Не поврежденных 6,3 6,1 5,3 4,4 4,3 3,6 
ПНЛИЛЬЩИКОМ в; 49 5,2 4,2 5,1 4,3 3,5 3,9 4,0 14 
3,8 4,0 
Поврежденных пи- 5,2 4,3 3,5 4,7 3,9 3,2 4,3 3,5 12 
лнльщиком Во 4,5 5,3 4,0 3,0 3,8 27 


УЎхА | 13 | | 13 | | 26 


таблицу, удобную для расчета вспомогательных величин, прел 
варительно умножив каждую варианту на К==10, что избави" 
нас от дробных чисел и облегчит вычислительную работу. Пре- 
образованные таким образом варианты и расчет вспомогателг- 
ных величин приведены в табл. 76. 

Так как анализируется двухфакторный пропорциональны 
комплекс, рассчитываем общие девиаты: О,==Хх?—Н== 


==49767— —49767—47816,34==1950,66. Уменьшаем эт“ 
= — 19,51; у=. 
п 


величину в К?= 100 раз: 2, == 


Ше сЕ 48759,98 ыы 47816,30) = 9,44; = 19,51—9,44= 
510,07. Затем находим факториальные девиаты: Ра= 
=У ем н= 1 (48538,28 — 47816,30 =” 7 

0,=У Чья Н =. 48085,32 — 47816,34 218.8 2,19 


Рав=р,— (22+ 05) ==9, и (7,22+2,19) =0,03. 
186 


Таблица 76 


д, В А, Аз 
Сумма 
т в, В, в, В, 
63 1 61 | 52 | 43 | 44 | 43 |3 | 3° 
53 | 49 | 45 | 35 | 36 | 43 | 43 | 30 а=? 
РА 52 | 42 | 53 | 40 | 35 | 39 | 38 | 27 6=9 
38 40 
п 7 6 б 7 6 №==26 
$; 358 268 280 209 1115 
(Хи): | 128164 71824 78400 43681 = 
2 
2:0 | 18309,14 11970,67 11200,00 7280,17 48759,98 
п 
ухи 18812 12212 11276 7467 49767 
я 76—13 74-613 26 
Ух, 358-268 ==626 2804-209-489 зи 
(5х)? 30144,31 18393,92 48538,23 
ПА 
пв 7+7=14 6--6=12 26 
Яхв 358--280=638 268-209 =477 а 
2 
(Св) 29074,57 18960,75 48035,32 
Пв 


Определяем числа степеней свободы: Ё,==М—1==26—1|==25; 
д = 0-1 ==92—1 == М Ёв==0— =2—1= э Рав= КаЁв==1; Ре== 
= №00 ==26—4==22, Относим девиаты к числам степеней сво- 
юды, что дает значение дисперсий, и сводим результаты анали- 
‚а в заключительную таблицу (табл. 77). 

Из данных табл. 77 видно, что нулевая гипотеза опроверга- 
‚тся как в отношении фактора А (Р<0,01), так и фактора В 
Р<0,05), хотя и на разных уровнях значимости. Следователь- 
10, с определенной уверенностью можно считать статистически 
‹оказанным, что на урожай крыжовника оказывают влияние и 
‘орт (А) и вредоносное действие крыжовникового пилильщи- 
:а Я 

еортогональные комплексы. Для двухфакторных ортого- 
тальных комплексов характерно равенство Р,=2л-+ Рв+ Рав. 
3 неортогональных комплексах, т. е. таких, в градациях кото- 
зых содержатся неодинаковые и непропорциональные числа ва- 
нант, это равенство нарушается, т. е. 2,5 р -Рв+ Рав, а сле- 
довательно, и Пдвзе Р, (Юл + Рв). Сохраняется лишь равенство 
20==0,+рг. Поэтому общие девиаты рассчитывают по тем же 
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формулам, которые используют при анализе равномерных + 
пропорциональных комплексов. 

Факториальные девиаты (Ра, Рв и Дав) рассчитывают в две 
этапа. Сначала находят значения некорректированных девиат 
обозначаемых здесь символами П’а, О’ви О’ав. Сумма эти: 
девиат равна некорректированной общей девиате О’,. Корректв 
руя неисправленные девиаты, получают девиаты исправленные 
т. е. не смещенные относительно равенства д,=Да--Ов--ДОаь 
Коррекцию девиат производят умножением их на поправочные 
коэффициент К=Д,/О’,. Дальнейший ход анализа проводят пс 
обычной для двухфакторных комплексов схеме, описанної 
выше. 


Таблица 7^ 


Дисперсионное отношение 


Варънрование |охабалы | Пере | | 

5% 1% 
7,22 

По фактору А 1 7,22 7,22 тас" 15,7 | 4,3 | 79 
2,19 

По фактору В 1 2,19 2,19 о = 4,8 43 | 7,9 
0,03 

Совместно АВ 1 0,03 0,03 Ута 0,06 | 43 | 79 

Остаточное 22 10,07 0,46 — — — 

Общее 25 19,51 — — – — 


Неисправленные девиаты определяют по следующим рабо 
чим формулам: 


0;.=м(2# -н); | (132 
рам | "д –н); (133 
р м (2. - ): (134 
Рав= 0; —(рА-- в). (135 


188 


де =хУх/п— групповые средние; Ха -- сумма групповых 
:редних для каждой из градаций фактора А; ХХв — сумма груп- 
товых средних для каждой из градаций фактора В; а — число 
‘радаций фактора А; $ — число градаций фактора В (в груп- 
ах А); п — численность вариаит в отдельных градациях комп- 
лекса; №== Хп —— объем комплекса. 

Пример 15. Изучали действие сока и паров чеснока, лука и 
терца на заживление гноящихся раи. Исследование проводили 
‹а одновозрастной группе подопытных животных. Эффект оце- 
ливали в условных единицах (в баллах). Результаты опыта 
риведены в табл. 78. 


Таблица 78 
Способ воздействия Чесиок | Лук | Перец Среднее 
Сок 7867 7652 3265 5,33 
Пары 546 5364 2433 4,09 
Среднее 6,14 4,75 3,50 — 
Таблица 79 
А, В А Аз А, 
Сумма 
т в, В, в! В, в, в, 
х 7861! 546 |765 |253|236| 243 а=3 
7 64 5 3 65=2 
п 4 3 3 5 4 4 М№М=23 
Уж 28 15 18 20 16 12 109 
УхИП= 2; 7,0 5,0 6,0 4,0 4,0 3,0 29 
ЕЭ 49 25 36 16 16 9 151 
(Хх:)2/п 196 75 108 80 64 36 559 
Хх: 198 77 110 90 74 38 587 
ХА | 7+5=12 | 6--4=10 | 443=7 | — 
(52 а/5)? | (12/2)2= | (10/2)2= | (7/2) = А.л =73,25 
== 36,00 —25,00 == 12,25 
Ув | 7--6--4==17 | 5--4--3==12 | — 
(ЗЕв/а)2 | 32,14 | 16,00 ћв = 48,14 
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Обозначим изучаемые факторы через А, а способы их воз: 
действия — через В и подвергнем эти данные дисперсионному 
анализу. Расчет вспомогательных величин приведен в табл. 79. 


2 
ОА 2102. .516,56, Рассчитываем общие девиаты: 


а5 Уху)? 
Ру==Ўх2—Н ==587—516,56== 70,44; р.- у —Н=559— 


7 
—516,56== 42,44 и р,==70,44—42,44=28,00. 

Числа степеней свободы: Ё,=М—1==23—1==22; К,==а6— 
—1=3.2—1==5; № ==М—аф==23—6==17. Дисперсии: 5,2== 
==42,44/5== 8,49; 5е?==28,00/17==1,65. Отсюда Рь==8,49/1,65==5,1. 
Эта величина превосходит критическую точку Ё,:= 4,34 для 

=1%. Следовательно, нулевую гипотезу отвергают на высо- 
ком уровне значимости (Р<0,01). 

Переходим к расчету некорректированных девиат. Предвари- 


х; \2 2 
тельно определяем величину н-=(2*. = 2.) =23,3. Под: 
а . 


ставляем известные величины в формулы (132), (133), (134) 
и (135): 


2 
Мм (22.-н) 93 (281-2336) 23. 1,807 —41,56; 
аб 6 


, ГА 
Бу =мМ№ (2 е н)=2з (22 23,36) 23. 1,507 =24,31; 


, А 
Ръ= М (2н) 23 (и — 23,36) =23:0,71= 16,33; 


Бав= 0, — (ра 4- Ов) = 41,56 — 24,31-- 16,33==0,92. 


Проверяем правильность расчетов: Р’, ==’, + р'в+ О’дв== 
==24,314 16,33 0,92==41,56. Расчет девиат произведен правиль- 
но. Находим поправочный коэффициент: К=2,/р',== 
= 42,44/41,56= 1,0212. Исправляем факториальные девиаты: 
Ра=р’АК==24,31.1,0212=24,82; Ов=0’вК=16,33.1,0212= 16,68; 
Дав==0’двК==0,92.1,0212==0,94. Проверяем `правильность рас- 
четов: 24,82 + 16,68 + 0,94==42,44=/),. Расчет девиат произведен 


правильно. 
Определяем числа степеней свободы для факториальных 
дисперсий: Ёд==0—1==3—1==9; Рь==ф—1==2—1==1; Рав 


==ЁдАв==2.1==2; ,==17 (см. выше). Относим девиаты к числам 
степеней свободы и сводим результаты анализа в заключитель- 
ную таблицу (табл. 80). 

Из данных табл. 80 ясно, что нулевая гипотеза отвергается 
на высоком уровне значимости (Р<0,01) как в отношеиии фак- 
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гора А, так и в отношении фактора В; недоказанным остается 
‘овместное влияние этих факторов на результативный признак. 
‘ледовательно, достоверно установлено, что лечебный эффект 
эт использования препаратов лука, чеснока и перца при лече- 
{ии гнойных ран различен. Доказано, что эффективность лече- 
чия этими препаратами зависит и от способов их применения. 


Таблица 80 
Е 24 
Варънрованне || ОИ, | Деваты | дилер. | ль 

5% 1% 
По фактору А 2 24,82 12,41 7,5 3,59 | 6,11 
По фактору В 1 16,68 16,69 10,1 4,45 | 8,40 
Совместно АВ 2 0,94 0,47 0,28 | 3,59 | 6,11 
Остаточное 17 28,00 1,65 — — — 
Общее 22 70,44 — — — — 


В тех случаях, когда выборка распределяется в вариацион- 
чый ряд удобной формой группировки исходных данных, под- 
лежащих дисперсионному анализу, служит решетчатая (корре- 
:яционная) таблица. 

Пример 16. Изучали продуктивность пчелиных маток трех 
`рупп различных пород (фактор А) в зависимости от условий 
х расплода (фактор В). Продуктивность маток (результатив- 
ый признак Х) оценивали по числу отложенных яиц (в сотнях 
птук) в среднем за два года. Полученные результаты и их об- 
заботка приведены в табл. 81. 

Здесь через { обозначены частоты классов (групп), распре- 
деленные по ячейкам таблицы; а; — отклонения равноотстоящих 
`рупп от условного нуля. Остальные символы объяснены выше. 

Как и в предыдущем примере, предварительно находим ве- 


.ичину Н == а = 269,12 и определяем общие де- 


маты: Ру= 2 (Хја,2) —Н = 334—269,12-—64,88; Р,= У а =. 


—Н=293,3—269,12=24,18; ).=64,88—24,18=40,70. Числа 
тепеней свободы: А,=50—1=49; Ё,=3.2—1=5; К.=50—6 = 
—44. Дисперсни: 5,2==24,18/5==4,836; 5е?==40,70/44==0,925. От- 
юда Рь==4,836/0,925==5,23. В табл. УТ Приложений для а= 
=1%; Ё,==5 и Ё.=44 находим ‹:=3,5. Нулевую гипотезу от- 
зергают на высоком уровне значимости (Р< 0,01). 
(Ух \?_ (13,94) 
Находим н=( рт ) 505 
“ориальные (некорректированные) девиаты по формулам 
132) — (135). 


=5,40. Рассчитываем фак- 
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Таблица 8 


20—219 5 
18—19,9 4 1 1 9 1 1 а=3 
16—17,9 3 4 2 1 2 2 3 Б==9 
14—15,9 2 3 4 3 4 3 3 
12—13,9 1 1 1 1 3 2 2 
10—11,9 0 
п 9 8 7 10 7 9 №50 
Уја, 39 19 18 (21 14 19 116 
уа? 120 51 54 |53 | 32 24 334 
№2 
Хы. 113,8 | 451 | 46,3 | 441 {280 | 160 293,3 
а 
27 25, 356] 2,381 2,57] 2,10] 2,00] 1,33] 13,94 
Е 1267| 5,66| 6,60| 4,41| 400| 1,77 35,11 
УҒА аве-2зв-ва4 257401. | 2.0-+-1,33 = — 
= 4,67 == 3, 
ха \2 ,94 2 4,67 \2 3,33 \2 
ри: (8) вво Е К (22) = | дл==17,04 
Ь 2 2 2 
У = 5,45 = 2,77 
Утв | зве+а8т+0-влз) зза ріл | — 
=5,81 
жв \2 ‚13 \2 5,81 \2 
(22. (2 =) =7,34 Ге) =3,75 | Вв=11,09 
2 3 3 
Таблица 8: 
Е, 
Варьирование тИ Цевнаты Диспереши Рф 
5% | 1% 
По фактору А 2 15,05 7,52 8,1 3,21 | 5,12 
По фактору В 1 8,06 8,06 8,7 4,06 | 7,25 
Совместно АВ 2 1,07 0,54 0,58 3,21 | 5,12 
Остаточное 44 40,70 0,925 — — — 
Общее 49 64,88 — НЕЕ —– | — 
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р: = 50:3 #)=506,85—5,40)—50-045—22,5; 
17,04 _ 

р 5022 )==50(5.68 — 5,40)—50-0,28 = 14.0; 

ры 50( н)-—50(5,55—540)—50.0,15-—7,5; 


Рав=22,5-— (14,0--7,5) = 1,0. 


Поправочный коэффициент К=О,/)О’,=24,18/22,50== 1,0747. 
Корректируем неисправленные девиаты: ДОа=14,0.1,0747 = 
== 15,05; Юв=7,5:1,0747= 8,06; Рав= 1,0: 1,0747= 1,07. Опреде- 
лив числа степеней свободы, сводим результаты анализа в таб- 
лицу (табл. 82). 

Нулевую гипотезу отвергают на высоком уровне значимости 
в отношении как фактора А, так и фактора В (Р<0,01). Сов- 
местное влияние факторов АВ не установлено. 

Для облегчения вычислительной работы желательно, где это 
возможно, переводить неортогональные комплексы в ортогональ- 
ные путем исключения «лишних» наблюдений из соответствую- 
щих градаций. При этом исключение должно быть случайным, 
нетенденциозным. 

Оценка силы влияния факторов. Силу влияния того или иного 
фактора или их совместного действия на результативный при- 
знак определяют с помощью следующих показателей: 


В = 54/5 ; (136) 
= 58/5; (137) 
ПАВ 54/52, (138) 


где $24== (524—52,)/0п, $2в== (52в—52,)/ап и ав (5? Ав—- 
—5?.) [п — факториальные дисперсин, определяемые по значе- 
ниям межгрупповых («неисправленных») и остаточной диспер- 
сий с учетом числа групп а в градациях фактора А и числа 
групп ё в градациях фактора В, а также численности вариант в 
группах п. Если комплекс неравномерный или пропорциональ- 
ный, величину п определяют по формуле 


о Хт) 
п М н |. (139) 


Знаменателем в формулах (136) — (138) служит величнна 
55 А 4-5в + 52Ав+5?.. Причем, если влияние одного из регу- 
лируемых факторов или их совместное действие на результатив- 
ный признак не установлено, т. е. статистически недостоверно, 
этот компонент из знаменателя исключают. 

Пример 17. При выяснении влияния микроэлементов (фак- 
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тор А) и породных свойств (фактор В) на жирномолочность 
коров (признак Х) достоверным оказалось лишь влияние факто- 
ра В. Определить силу влияния этого фактора на признак. Выше 
было найдено: $2в=2,65; 5?,=0,26; п=3 и а=3. Определяем 
$2 в=== (2,65—0,26) /(3.3) =2,39/9=0,266. Подставляем нужные 
данные в формулу (137): #2, -=0,266/ (0,266-- 0,26) = 
=-0,266/0,526==0,50. Тот же показатель, определяемый по спосо- 
бу Плохинского, оказывается несколько выше: й?в= Рв/ру= 
—7,94/15,78==0,53. Проверим достоверность этого показателя. 

1. По Снедекору, #?в=0,50. Исходные данные: 52в==2,65; 
52.=0,26; М==36; 6=4 (см. табл. 71). Отсюда Еу==2,65/0,26= 
= 10,2. По табл. УІ Приложений для Ав=6—1=4—1==3; Ке== 
== М6 —=36-—4=32 и а=1% находим Ри==4,46. Так как 
Еъ> Еѕі, нулевую гипотезу отвергают на высоком уровне значи- 
мостн (Р<0,01). 

2. По Плохинскому, й2в= 0,53. Ошибка показателя силы 
влияния 512 в== (1—0,53) (4—1) / (36—4) =1,41/32==0,044. Отсюда 
Еф==0,53/0,044==12,05. Эта величина превышает Р5{=4,46, что 
позволяет отвергнуть нулевую гипотезу на высоком уровне зна- 
чимости (Р< 0,01). 

Пример 18. Определить силу влияния фитонцидов лука, пер- 
ца и чеснока (фактор А), а также способов их воздействия (фак- 
тор В) на заживление гнойных ран (признак Х). В данном слу- 
чае комплекс неравномерный. Здесь М№М=23; а==3; 6=2 (см. 
табл. 79); 524== 12,41; 52в==16,68; $2,== 1,65 (см. табл. 80). 

Находим усредненную величину п (по Снедекору): 


2 2 2 2 2 -- 42 
РЕА 1 (23+ 4-32 4-32 4- 52 -- 42 -- 4 —3,81. 
3.2—1 23 
^9 5 — 52 
Рассчитываем факториальные дисперсии: $А= ны 
п 
2 2 
12,41 — 1,65 10,76 А2 ба — 5, 16,68 — 1,65 
3,81.2 Тб ЗО 3,8173 
2:12:08 1,815 
11,43 


Знаменатель 52,==1,412-+ 1,315 + 1,650==4,377, откуда №, == 
== 1412 0,393; № 0,300; 02-3689 0,377. 

4,377 4,377 4,377 
Отсюда следует, что доля общей вариации признака, определяе- 
мая влиянием фактора А, равна 32,3%, тогда как доля общей 
вариации, связанная с влиянием на признак фактора В, равна 
30,0%. Остальные 37,7% общей зарина признака вызваны 
влиянием неорганизованных (случайнмх) факторов. 

Те же показатели, вычисленные по методу Плохинского, ока- 
зались равными Ад=04/Р,=24,82[70,44 == 0,352; А2в=рь/р = 
=16,68/70,44=0,237; Һ2,=2,|р,==28,00/70,44= 0,398. Сумма 
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А? А А-А в-- А2, 0,352 4- 0,237 + 0,398 0,987, т. е. не ==1. Это и по- 
нятно, если учесть, что здесь взяты не исправленные величины, 
а просто девиаты и величииа Й?дв не вычислялась; при таких 
обстоятельствах сумма всегда будет меньше единицы. 

Проверим достоверность этих показателей. 

1. По Снедекору. Исходные данные: Л№=23; а=3; Ь==2; 
524==12,41; 52в== 16,68; 52,= 1,65. Отсюда для й? ==0,323 крите- 
рий Ёл = 12,41/1,65=7,52. Эта величина превосходит критиче- 


скую точку Ёз:==5,85 для Ё==0—1==3-—|1==2; А.==М-—а= 
==23—3==20 и а== 1%; Рв== 16,68/1,6510,11. Эта величина пре- 
восходит критическую точку Ё,:==8,02 для Ев==а—1==2—1==1; 


Ке==23—2==2] и а== 14. Но-гипотезу отвергают на 1 %-ном уров- 
не значимости. 

2. По Плохинскому. Ошибка для А24 = 0,352 составит 
ОЯ —=(1— 0,352) (3 — 1)/(23 —3)==1,296/20==0,065. Отсюда ҒА == 


=(),352/0,065= 5,42. Эта величина превосходит Е,:=3,49 для 
К1==2, Р.==20 и а==5%. Ошибка для А2в= 0,237 составит 5,2 == 


==(1 0,237) (2 — 1)/(23-—-2)=0,763/21 =0,036. Отсюда Е в== 
==0,237/0,036== 6,58. Эта величина превосходит Р:‚==4,32 для 
== и Ё2=21, а также а==5%. Таким образом, Но-гипотеза от- 
вергается по Снедекору на 1%-ном, а по Плохинскому — на 
5%-ном уровне значимости (0,01<Р< 0,05). 


УП.3. АНАЛИЗ ТРЕХФАКТОРНЫХ КОМПЛЕКСОВ 


Выше уже было показано, что с увеличением числа органи- 
зованных факторов, воздействующих на результативный признак, 
увеличивается и число их возможных сочетаний, усложняется 
символика, особенно при определении девиат. В остальном орга- 
низация и анализ многофакторных комплексов принципиально 
не отличаются от простых комплексов. Схему анализа трехфак- 
торного равномерного комплекса можно представить в виде сле- 
дующей заключительной таблицы (табл. 83). | 

Здесь А, В, С — организованные факторы, воздействующие на 
результативный признак Х; пд == пас — количество вариант в от- 
дельных градациях фактора А; пв==пЬс — количество вариант 
в каждой градации фактора В; пс= пар — количество вариант в 
каждой градации фактора С; а, Б, с — число градаций или групп 
факторов А, В, С; п — численность вариант в отдельных града- 
циях комплекса; Хлп== пабс== № — общее число вариант, входя- 

ХО лв)? 


щих в дисперсионный комплекс, его объем; Адв= 
пс 


лс) Яхве)? 
—Н; ве Аб; Ивс= ве? зопомогателе: 
п па 
он блі 
ные величины; Н= А27. -общая для всех девиат величина. 
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Анализ трехфакторных комплексов начинают, как обычнс. 
с определения Хх, Х(Хх:)? и Хх?:. Затем рассчитывают де. 
виаты общую Ду, факториальную, или межгрупповую, О, и остг 
точную Де; устанавливают числа степеней свободы #,, Ё; ил. 


Таблица 8: 
Вариация Степени свободы Е Девиаты О 
Общая Ву №1 Рру= У (5х) – Н 
2 
Межгрупповая Ё. == 00-1 Р, = е - Н 
Внутригрупповая, Роу Ёх Ре=Ру—ПОх 
или остаточиая р 
По фактору А ВА==а—1 Пл = Зар Н 
2 
› В наб рв= 287 _ н 
лв 
(2 
» С Ёс ==0-—1 Рс == 50502 —Н 
пс 
Совместиого Ёдв==ЁАЁв "”Рлв==ћав--(0А+0в) 
действия АВ 
» АС РАС=РАЁС Рас==йАс—(РаА-+Ос) 
» ВС Евс=ЕвЁс Рвс==ћвс— (рв Рс 
А АВС Елвс==ЁлЁвЁс Равс==Ю,--(рА4+рв-+-рс+ 


+рАв--Рас+0 вс) 


Делением девиат на числа степеней свободы определяют диспег- 
сии 52, и 5?.. Дисперсионное отношение находят по факториал 
ной дисперсии, отнесенной к остаточой дисперсии, т. е. Еф= 
==52,/5?. (при 52,225). Если ЕҒфр> Ё, для Ёх, Ё и а, то Но-гип‹- 
тезу отвергают, что дает основание для перехода к расчету фаь 
ториальных девиат Па, Бв, Ос и девиат совместного действия 
Рав, Рас, Рвс, Олвс. Результаты вычислений сводят в заключь 
тельную таблицу с последующими выводами. Таким образом, каг 
и в рассмотренных выше случаях, наибольших усилий и внима 
ния требуют расчеты девиат. Другие действия сравнительн‹ 
просты и не требуют дополнительных разъяснений. 

Пример 19. Описанный ход анализа легче усвоить из соответ 
ствующего примера. В табл. 84 сгруппированы и частично обра 
ботаны данные о влиянии трех независимых факторов А, Ви С 
на результативный признак Х. Здесь п==4, а==2, Б==2, с==4 
2х: — сумма вариант в отдельных группах или градациях комг 
лекса, а 2; — групповые средние арифметические. Остальные 
символы понятны из табл. 84, Объем комплекса №-=4.2.2.4=6- 
Величина Н =17282/64 =46656. Определяем девиаты: Ру=Хл?— 
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—Н=48 698—46 656=2042; р.—2 6120 р 19402 _ 


п 
—Н=1867; Р.=р,—ШО.==175. Числа степеней свободы: == 
=/М—1==63; Ех== (а6с)—1==16—1==15; Ее==Ку- == 
=63—15==48. Дисперсия: $2„== 1867/15 == 124,47 и 52,= 175/48 == 
=3,65. Критерий Рф= 124,47/3,65=34,10> Е, =2,48 для А, = 15, 
==48 н а==0,01. Но-гипотезу отвергают на высоком уровне зна- 
зимости (Р<0,01). 


Таблица 84 
а Состав градаций (х;) 
Хх; (Хх)? Хх ЕА 
А в с 1 2 3 4 
С! 17 18 21 20 76 5 776 | 1454 | 19,0 
В С 19 21 22 22 84 7 056 |1770 1 21,0 
1 Сз 20 22 23 23 88 7 744 |1942 | 22,0 
С, | 20 | 23 | 24 | 25 92 | 8 464 |2130 | 23,0 
А, ! | 
С; 19 22 24 23 88 7 744 | 1950 | 22,0 
В С, 21 22 25 24 92 8 464 |2126 | 23,0 
2 Сз 21 24 26 25 96 9216 | 2318 | 24,0 
С. 23 23 25 25 96 9216 | 2308 | 24,0 
С! 24 26 29 28 107 11 449 |2877 | 26,8 
В С. 27 28 32 30 117° 13689 | 3437 | 29,3 
1 Сз 26 30 31 32 119 14161 | 3561 | 29,8 
С. 30 29 33 32 124 | 15376 | 3854 | 31,0 
Аз 
01 29 30 32 33 124 15 376 | 3854 | 31,0 
В С, 31 32 35 34 132 17 424 | 4366 | 33,0 
? Сз 34 35 38 37 144 | 20736 | 5194 | 36,0 
С. 36 38 39 36 149 | 22201 | 5557 | 37,3 
сумма | | — | — | — | — | 1728 | 194 092 | вов — 


Переходнм к расчету факториальных девиат ДА, Ов, Ро. 
“начала определяем суммы вариант Хх; для каждой градации 
‹омплекса (см. табл. 84). Затем, суммируя числовые значення 
зсех возможных сочетаний независимых факторов А, В н С, на- 


тодим Уха, Ўхв н ХЎхс. Начнем с определения Ххд и Ўхв 
табл. 85). 


Отсюда Р, 
—46 656 == 1444; 


(хд)? р 7122 +10162 


— Н ==48 100 — 
пас 32 
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Таблица 8: 


ву | В, | ХХ, 
А, 76-+-84-1-88--92 ==340 88--92--96--96==372| 712 
А 107--117--119-124 =467| 1944-13924-1444-149==549] 1016 


Ххв | 807 | 921 | 


Таблица 8: 


84--92 == 176 


А, 76--88==164 88--96=184| 92-96188 
д, 107--124==231 | 117432==249 | 119-144 ==263 | 1244-149-273 
Ухо | 395 | 495 | 447 | 461 


2 
рь ==» н = 91 н. 46659,06 Н—203,06. 
пос 
Сочетая значения факторов А; и Аз по С1-4, находим Хх: 
(табл. 86). 


Хх} 2 4- 4252 +4472 2 
Определяем он а НЕ 


пар 4.2.2 
748 98 
– н = 2990 — Н = 46811,25 —46656 == 155,25. 

Расчет девиат совместного действия Дав, Рас, Овс и Раве 
совершается последовательно в два приема: сначала находя" 
величины Аав, ВАСИ Авс, затем определяют девиаты совместног‹ 
действия. Исходные данные для определения Йдв и Ал: 
приведены в табл. 85 и 86, а для определения Авс — в табл. 8: 
содержащей сочетание числовых значений факторов ДВ; и Ё. 
по (1-4 


У = (дв), в} — н— 3402 +3728 +-4672 + 5492 


Отсюда Йдв == 14 — Н = 
773 474 2 

а О: ея 46 656 —1686,13; лс = Реж» 
СУ Н !8 +1762 -{- 1842 -4- 1882 4- 2312 4 2492 + 2632-2132 _ ИЕ 
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= #6102 н _.48266,50— Н ==1610,50; пас во) _ Н = 
РАА 1832 -|- 2012 -|- 2072 -|- 2162 -1- 2122 +- 2242 4- 2402 4- 2452 Е 
4.2 
= — Н=47017,50 —46656,00 = 361,50. 


Таблица 87 
С 
рр с | с, | с, | с, 
В 
В! 76 + 107 = 183 |84 - 117 = 201 |88 - 119 = 207 |92 + 124 = 216 
В, 88 -- 124 == 212 [92 + 132 = 224 |96 + 144 = 240 |96 + 149 == 245 
Ххс | 395 чая чт 461 


Переходим к определению девиат совместного действия: 
Зав==ЙАв— (РА-+-Ов) =1686,13—1444--203,06=39,07; Рас== 


= Ас (ра + Рс) =1610,50—1444 ++ 155,25 = 11,25; Рвс== 
Таблица 88 
Дисперсионные отиошення 
Е Ри 
Вариация се А В 
0,05 0,01 
По фактору А 1 1444,00 | 1444,00 | Ед= 4,04 7,20 
==395,6 
» В 1 203,06 203,06 |Рв==Ф55,6| 4,04 7,20 
э (0) 3 155,25 51,75 |Рс==14,2| 2,80 4,22 
Совместная АВ 1 39,07 39,07 | Рав== 4,04 7,20 
==10,7 
» АС 3 11,25 3,75 |Едсе==1,0| 2,80 4,22 
» вс 3 3,19 1,06 | Ёвс 2,80 4,29 
==0), 
> АВС 3 11,18 3,73 | Равс== | 2,80 4,22 
Эстаточная 48 175,00 3,65 ==1,0 — — 
Общая 63 2042,00 — ИИ — — 
5 Авс— (рв + Рг) —361 ,50—203,06- 155,25 = 3,19; П двс== 


=Бх — (ра+рв-+-рс+Ррлв4+рас4-Рвс) = 1867— (14444-203,064- 

-155,25-- 39,07 + 3,19-+ 11,25) ==1867—1855,82 == 11,18. 
Устанавливаем числа степеней свободы. В данном комплексе 

4—2, 2=2, с=4, Отсюда Ёд==@а—1=2—1=1|; Ёв= 6—1 == 
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=2—1=1; Ёс== ——1==4— == 8; Рав==РАЁв== 1; Вас==ВАЁс== 
= 1 .3=3; Ево = ЁвЁс= 1 :3= 3; Ёавс= ЕАЁВЁС = 1 Ы 1 .3=3. 

Делим девиаты на числа степеней свободы и определяем дис- 
персии; сводим результаты анализа в заключительную таблицу 
(табл. 88). Из табл. 88 следует, что нулевая гипотеза отвергает- 
ся на 1%-ном уровне значимости лишь в отношении действия на 
признак факторов А, В, С и совместного действия факторов АВ. 
Влияние на результативный признак остальных сочетаний фак- 
торов остается статистически недоказанным. 


ҮІ1.4. АНАЛИЗ ИЕРАРХИЧЕСКИХ КОМПЛЕКСОВ 


Наряду с рассмотренными выше схемами, где возможны лю- 
бые комбинации факторов, воздействующих на признак, в прак- 
тике встречаются и такие дисперсионные комплексы, в которых 
свободное комбинирование факторов друг с другом исключено, 
Такие комплексы называют иерархическими. Они организуются, 
например, при изучении наследственного влияния родительских 
поколений на продуктивность или поведение потомства, при 
выяснении взаимоотношений между родственными в системати- 
ческом отношении группами живых существ и в других подоб- 
ных случаях. 

Характерной особенностью таких комплексов является опре- 
деленная иерархическая соподчиненность их структурных компо- 
нентов, когда группы относительно низкого ранга находятся в 
строгой зависимости от связанных с ними групп более высокого 
положения. Наглядно эту зависимость можно выразить в виде 
следующей примерной схемы: 


Отцы Я 


Матери (1) (2)... (п) 


Дети 12.1 12.0 1 2..0 12.0 12.0 12..п 12.7 12.71 12.0 


Анализ иерархических комплексов имеет свои особенности, 
обусловленные невозможностью свободного комбинирования 
различных групп по фактору В из разных градаций фактора А, 
занимающего более высокое положение в общей схеме иерархи- 
ческого комплекса. При обработке таких дисперсионных комп- 
лексов не вычисляют дисперсию 5?лв совместного действия фак- 
торов АВ, несколько по-другому выглядят дисперсионные отно- 
шения Рф, иначе по сравнению с обычными многофакторными 
комплексами определяют факториальные дисперсии. 
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Как и прочие, иерархические комплексы могут быть равно- 
терными, пропорциональными и неравномерными. Структура 
терархического комплекса зависит от количества учитываемых 
оакторов и их градаций. Простейшей иерархической схемой яв- 
зяется схема двухфакторного дисперсионного анализа. Ее мож- 
о представить в виде следующей таблицы (табл. 89). 


Таблица 89 
Среднне 
Число степе- |Девиа-| КВадраты Е Факторналь- Сила 
Варьирование| ней свободы ‘тыр | НЛН ДИС" Ф ные днспер- | влняиия 
. Ё Перси сии факторов 
х 
2 2 
р $1 2 $ 
2 А —$ А 
По фактору Ёа=а-—1  |Ол П Ра а [52 = $1 — 5212 = = 
А А 55 рп 5у 
2 2 
$, 5 
В 2 — В 
По ‘фактору|в=а(5-—1)| Ов {52=— | Ев= |02 52 —— 5р2, с. 
х 
В В 5 п 59 
р р в 
е 
Эстаточное | Ае== р, |52 — а | 
=а6(п—1) е е 52 
р 2 2 2 
Эбщее Ву = №1 р, — ее буд + ВА + 
2 2 2 
в +5. | + в + 


П —————————————___ лл 


Общие суммы квадратов отклонений, или девиаты Ш, опреде- 
ляют по общим для всех комплексов формулам (109), (110) и 
111). Факториальные девиаты определяют следующим образом: 
д — по формуле (127) для равномерных комплексов или по 
оормуле (129) для неравномерных и пропорциональных комп- 
іексов, а девиату Ов — по формуле 


р, 500° _ ХА 


п п 


(140) 
А 


‹ для неравномерных и пропорциональных комплексов — по 
ной формуле: 
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в 2 
р,=У Фау -Ӱ Ау (141) 
1 


ба 


При этом Бу== 24 +Рв+Р,, равно как и Ку==АА-+Ёв-+е. Здесь 
х; — варианты, находящиеся в градациях комплекса АВ; ха -— 
варианты, находящиеся в градациях фактора А (занимающего 
самое высокое положение в иерархической схеме); п; — числен- 
ность вариант в отдельных градациях комплекса; пд — количест- 
во вариант в каждой из градаций фактора А; Уп:==Унд==М — 
общее число вариант, входящих в состав данного комплекса, его 
объем. 

При неодинаковой численности вариант в градациях комплек- 
са в качестве знаменателя в формулах для определения факто- 
риальных дисперсий 524== (521—522) /Би и 52в== (52—52) [п берут 
усредненные величины бп и ӯ, вычисляемые по следующим фор: 


мулам: 
1 Х (па) ): 
п= А578, (143) 
1 Ул \ Уп 13 | 029 
где Пд = (— п, )- ү Е № р п, . 


В этих формулах а — число градаций фактора А; Б — число гра- 
даций фактора В; п — численность вариант в отдельных града- 
циях комплекса; пд — численность вариант в каждой из града- 
ций фактора А и №М==Уп==Упд — объем всего дисперсионного 
комплекса. 

Формулы для определения чисел степеней свободы Ави Ё, 
приведенные в табл. 89, применяют к комплексам с равночислен- 
ными группами фактора В, находящимися в градациях факто- 
ра А, т. е. здесь 6 обозначает численность групп фактора В в 
отдельных градациях фактора А. | 

Можно, однако, определять число степеней свободы Ав и Ёе 
исходя из учета общего числа групп фактора В, входящих в дис- 
персионный комплекс 6’, по формулам Ёв==’—а; Е== №6”. 
Эти формулы универсальны, пригодны для определения Ав и А 
при наличии равночисленных и неравночисленных групп факто- 
ра В, находящихся в градациях фактора А дисперсионного комп- 
лекса. . | 

Рассмотрим иерархическую схему двухфакторного равномер- 
ного и неравномерного комплекса на конкретных примерах. 

Пример 20. Изучали влияние породных свойств хряков Баро- 
на А; и Сокола Аз на плодовитость их дочернего потомства Х, 
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толученных от трех свиноматок В. Плодовитость дочерних осо- 
зей учитывали по числу живых поросят в их пометах. Результа- 
^ы испытаний приведены в табл. 90. 


Таблица 90 
О БН Барон Сокол 

Мазеренсков поколение в, | в, | в, в, | в, | в, 
Число поросят в поме- | 76 89 97 | 10 8 98 12 10 
тах дочерних особей 8 8 9 11 7 9 

х 7 10 9 | 10 8 10 

Ёв | 7,00 | 8,75 | 8,50 | 9,75 | 8,00 | 10,25 

ХА | 8,08 | 9,33 


Из табл. 90 видно, что групповые средние тв, характеризую- 
цие плодовитость дочерних особей каждой свиноматки в отдель- 
гости, а также средние показатели плодовитости дочерних осо- 
зей по. отцам Хд варьируют как внутри групп А, и 42, так и 
лежду группами. Нужно выяснить, существенны ли расхождения 
лежду средними показателями и какова сила влияния органи- 
:ованных и неорганизованных факторов на величину варьирова- 
‘ия результативного признака, т. е. на плодовитость дочерних 
›собей. 

Қак обычно, начинаем с расчета вспомогательных величин, 
еобходимых для определения сумм квадратов отклонений 
табл. 91). Подставляя известные величины в формулы, нахо- 
дим: Р,=Ух?—Н==1867—2092/24—= 1867—1820,04= 46,96; 


2. = н = —Н=1847,75— 1820,04 —=97,71; 2. = 
п 


х 


У(Х хд)? н 21953 х: 


=р,-—0,=46,96—27,71== 19,25; О, == 


Пд 12 
А 2 
– Н == 1829,49 — 1820,04 = 9,38; БЕ (Хх)? Ел Е 
Г А 


= 1847,75 — 1829,42 = 18,33. 

Определяем числа степеней свободы: = №—1==24—1 =23; 
А=а—1=2—1==1; Ева (6—1) =2 (3—1) =4 или Ав==6’—а= 
=6—2=4; К.=аһ(п—1) =2:3(4—1) =18 или №=МЫ—'== 
=24—6— 18. 

203 


Таблица 9 


Хряки А: Аз 
А с 
РИ Ви, | в, | в, в! в, | в, а 
7 8 9 10 9 12 
Дочериие 6 9 7 8 8 10 а=2 
особи 8 8 9 10 7 10 Ь=3 
х: 7 10 9 п 8 9 
п | 4 | 4 | 4 | 4 | 4 | 4 | М=94 
Ух; | 28 | 35 | 34 | 39 | 32 | 41 | 209 
(2х:)? 784 | 1225 | 1156 | 1521 | 1024 | 1681 | 7391 
Ух? 198 | 309 | 292 | 385 | 258 | 425 | 1867 
ПА | 12 | 12 | 24 
УхА 97 | 112 | — 
(Хх)? 9409 | 12544 | 21953 


Делим суммы квадратов отклонений (девиаты) на числа сте 
пеней свободы и сводим результаты анализа в таблиц" 
(табл. 92). 

Нулевая гипотеза отвергается на 5%-ном уровне значимості 
только в отношении фактора В (влияние различий материнских 
особей). Факториальная дисперсия $2в== (522—52,) [п = (4,58— 
— 1,07) /4=3,51/4=0,88. Общая дисперсия 52,=52в-+52,== 0,88 ~ 
+ 1,07 = 1,95. Отсюда показатели силы влияния факторов: А?в= 
==525/52,=0,88/1,95==0,451; И? ==52./5?,=1,07/1,95==0,549. Эт 
означает, что 54,9% общего варьирования результативного прь 
знака (плодовитость дочерних особей) обусловлены влиянием 
неорганизованных (случайных) факторов и 45,1% общей вариг 
ции признака определяется компонентом материнских особей !. 


1 Разумеется, эта доля общей вариации результативного признака опре 
деляется не только генотипическим разиообразием матерей, но и совместных 
влияиием родителей (хрякиХсвиноматки) на плодовитость дочерних особе. 
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Рассчитанные таким образом показатели силы влияния фак- 
"оров есть не что иное, как коэффициенты внутриклассовой кор- 
‚еляЦии гш; в селекционно-генетических исследованиях их ис- 
ользуют в качестве показателей наследуемости й? в широком 
змысле '. 


Таблица 92 
Р. 
Барьнрованне | ИА | Дезаты | Даслер, | иене Г 
По фактору А 
(между хряка- 1 9,38 9,38 Ра= 7,71 | 21,20 
ми) —9,38/4,58== 
По фактору В ==2,0 
(виутри группһ 4 18,33 4,58 Ев== 2,93 4,58 
хряков) ==4,58/1,07= 
==4,3 
Остаточное 18 19,25 1,07 — — — 
Общее 23 46,96 — — > Ех 


Пример 21. На основе данных родословных записей была 
составлена выборка по такому признаку: процент жира в молоке 
коров дочернего поколения по второму и третьему отелам 
(табл. 93). 

Подвергнем двухфакторный неравномерный иерархический 
комплекс дисперсионному анализу. Предварительно уменьшим 
каждую варианту х; на три единицы, что облегчит расчет вспо- 
могательных величин, нужных для определения девиат 
(табл. 94). 

Определяем общие девиаты комплекса: Ӣу== Ӱх2;-—Н == 


= 34,50—36,62/40= 34,50—33,49— 1,01; р.= УС Еву. — 


== 33,39 — 33,49 0,40; Р,= Рр, —Р,== 1,01—0,40=0,61. Перехо- 
(Ў х д) 


дим к определению факториальных девиат: О, = > 
п 


А 2 (Ух, 
— Н-=33,79—33,49—0,30: 0= У (50° _ 2247 33,69 
п ПА 
— 33,79 =0,10. 
1 Если наследуемость в широком смысле определяют как отношение днс- 
персии, характеризующей генетнческое разнообразне 5,2, к сумме генетнческой 


н паратнпнческой, нлн средовой 5е?, дисперсий, т. е. А? = ‚ тов уз- 


с ЕДЕ 
А + 52 
ком смысле иаследуемость й? определяют отношением аддитивной дисперсни 
5а? к сумме трех компонентов нзменчивости: генетической дисперсин, средовой 

2 
5 
а 


и аддитнвной, т, е, 2 ==, 
у 524-52 + 52 
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Таблица 9: 


Отцов- Дочерние поколения ны 
ское | Материн- редние 
поко- ское по- 
ление |коленне В = 5 
А | 2 Е 4 5 6 7 Хв ХА 
1 4,0 3,8 3,6 3,8 3,80 
1 | 2 | 39 | 37 | 3:8 | 37 | 3,5 | | |= 3,76 
3 4,0 4,1 3,9 4,0 4,00 
П 4 49 | 40 | 40 1 39 | 40 { 41 3,8 | 4,00 | 3,97 
5 3,9 | 3,9 40 | 3,8 3,90 
6 4,1 4,2 4,0 3,9 4,0 3,8 4,00 
П 7 4,0 41 4,1 3,8 3,9 3,98 | 3,95 
8 3,9 3,9 3,8 4,1 3,6 3,86 


Устанавливаем числа степеней свободы: А=М— |= 
==40-—-1=39; КА=а—1==3—1==2; #в==Ь—а=8—3==5; 
Ве=М— 6 =40—8=32. 

Делим суммы квадратов отклонений (девиаты) на числа сте 
пеней свободы и сводим результаты дисперсионного анализа Е 
таблицу (табл. 95). Статистически достоверным оказалось влия 
ние фактора А (Р< 0,05). 

Переходим к расчету факториальных девиат. Предварительн‹ 


находим усредненные значения ъп и ж фп = (©- 
2 2 \ А А 
—_ 92 +15 = 40 6 12,98 = 13; лад = =” 


40 2 9 
42 4-72 4-42 | 62452452 42 52 4-42 4-72 442 4-62 4-52 452 
а ыы 
== 28.6766 5,20=2,46; 76 = (40 — 15,33)== 2а 
3,59. 
Отсюда й = 2.6 +3,52 0 99.3, 


Определяем факториальные дисперсии: 


2 81—52 — 0,150 — 0,020 —0,01; 
ёп 13 
2 0,020 — 0,019 
О, 00033. 
Общая дисперсия 52, —=0.010--0,00033+0,019—0,0208. Отсюдг 
сила влияния факторов: /А?4=0,010/0,0293=0,341; Ав= 
== (),00033/0,0293— 0,011; А2, == 0,0190/0,0293= 0,648. 
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ы И 94 


Отцовское А: А, Аз 
поколение 
Сумма 
аша? ра [а |а ја а |а аА _ а | а [а | в | в | а | а | № 
Процент жира в] 1,0 0,9 1,0 1,2 0,9 1,1 1,0 0,9 
молоке доче-| 0,8 | 0,7 | 111 1,0 0,9 121 11 0,9 | а==3 
рей 0,6 | 0,8 0,9 1,0 1,0 1,0 11 0,8 |6=8 
х; 0,8 0,7 1,0 0,9 0,8 0,9 0,8 1,1 
0,5 1,0 1,0 0,9 0,6 
11 0,8 
0,8 
п 4 5 4 7 4 6 5 5 = 
—40 
3,2 3,6 | 40 7,0 3,6 | 6,0 4,9 4,3 | 36,6 
РА 10,241 12 '96 16,0 | 49,0 | 12,96| 36,0 24, 01| 18, 49| — 
Сх 
к 2,56| 2,591 4,0 7,0 3,24] 6,0 4,80] 3,70| 33,89 
Ух? 2,64] 2,608] 4,02| 7,10! 3,261 6,10) 4,87| 3,83| 34,50 
О То [в ре | 15 | | 
УХА в в | 14,6 | | 36,6 
(Ўхал)? 46,24 213,16 231,04 — 
(ха)? 5,14 14,21 14,44 33,79 
ПА 
Таблица 95 
Р 
К | Далер. | Дитерааде 
По фактору А 2 0,30 0,150 Ед== 5,79 | 13,27 
000502 
По фактору В 5 | ото | 0,020 ры 251 | 3,65 
==0,020/0,019 = 
$ =1,1 
Остасочное 32 0,61 0,019 — — — 
Общее 39 1,01 — — — — 
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Из` приведенных расчетов факториальных дисперсий и пока- 
зателей силы влияния факторов Аи В (хотя действие В на 
признак и не было доказано) становится ясным, каким образом 
можно разложить общую дисперсию комплекса на составляю- 
щие ее компоненты, выявить силу влияния каждого компонента 
на общее варьирование результативного признака. 


ГЛАВА УШ 
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 


Функциональная зависимость и корреляция. Еще Гиппократ 
в УІ в. дон. э. обратил внимание на наличие связи между тело- 
сложением и темпераментом людей, между строением тела и 
предрасположенностью к тем или иным заболеваниям. Опреде- 
ленные виды подобной связи выявлены также в животном и рас- 
тительном мире. Так, существует зависимость между телосложе- 
нием и продуктивностью у сельскохозяйственных животных; из- 
вестна связь между качеством семян и урожайностью культур- 
ных растений и т. д. Наличие связей между варьирующими 
признаками обнаруживается на всех уровнях организации живо- 
го. Поэтому естественно стремление использовать эту законо- 
мерность в интересах человека, придать ей более или менее точ- 
ное количественное выражение. 

Для описания связей между переменными величинами приме- 
няют математическое понятие функции ў, которая ставит в соот- 
ветствие каждому определенному значению независимой перемен- 
ной Х, называемой аргументом, определенное значение зависимой 
переменной У: у=}(х). Здесь х — аргумент, а у — соответствую- 
щее ему значение функции }(х). Такого рода однозначные зави- 
симости между переменными величинами У и Х называют бунк- 
циональными. Примеров функциональной зависимости между 
переменными величинами много. Известно, что повышение тем- 
пературы на 10°С ускоряет химическую реакцию в два раза, 
объем куба однозначно определяется по длине одного из его 
ребер и т. д. 

Однако такого рода однозначные, или функциональные, связи 
между переменными величинами встречаются далеко не всегда. 
Известно, например, что между ростом и массой тела у челсвека 
существует положительная связь: более высокие индивиды 
имеют обычно и ббльшую массу тела, чем индивиды низкого 
роста. То же наблюдается и в отношении качественных призна- 
ков: блондины, как правило, имеют голубые глаза, а брюнеты — 
карие. Однако из этого правила существуют исключения, когда 
сравнительно низкорослые индивиды оказываются тяжелее высо- 
корослых, и среди населения, хотя и не часто, встречаются каре- 
глазые блондины и голубоглазые брюнеты. 
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Причиной таких «исключений» является тот факт, что каждый 
биологический признак представляет собой функцию многих 
переменных: на него влияют и генетические, и средовые факто- 
ры, что и обусловливает варьирование признаков. Поэтому зави- 
симость между биологическими признаками имеет не функцио- 
нальный, а статистический характер, когда в массе однородных 
индивидов определенному значению одного признака, рассматри- 
ваемого в качестве аргумента, соответствует не одно и то же чис- 
ловое значение, а целая гамма распределяющихся в вариацион- 
ный ряд числовых значений другого признака, рассматриваемого 
в качестве зависимой переменной, или функции. Такого рода 
зависимость между переменными величинами называется корре- 
ляционной или корреляцией 1. 

Функциональные связи легко обнаружить и измерить на еди- 
ничных и групповых объектах, однако этого нельзя проделать с 
корреляционными связями, которые можно изучать только на 
групповых объектах методами математической статистики. Кор- 
реляционная связь между признаками бывает линейной и нели- 
нейной, положительной и отрицательной. Задача корреляцион- 
ного анализа сводится к установлению направления и формы 
связи между варьирующими признаками, измерению ее тесноты 
и, наконец, к проверке достоверности выборочных показателей 
корреляции. 

Зависимость между переменными Ү и Х можно выразить ана- 
литически (с помощью формул и уравнений) и графически (как 
геометрическое место точек в системе прямоугольных коорди- 
нат). График корреляционной зависимости строят по уравнению 
функции ух=/ (х) или х,==} (у), которая со времен Гальтона по- 
лучила название регрессии. Здесь ух и х, — средние арифметиче- 
ские, найденные при условии, что Х или У примут некоторые зна- 
чения х или у. Эти средние называются условными. Регрессион- 
ному анализу посвящена следующая глава. Здесь же будут 
рассмотрены параметрические и непараметрические способы 
анализа линейных и нелинейных статистических связей. 


У.4. ПАРАМЕТРИЧЕСКИЕ ПОКАЗАТЕЛИ СВЯЗИ 


Коэффициент корреляции. Сопряженность между переменны- 
ми величинами Уи Х можно установить, сопоставляя числовые 


1 Этот термнн (от лат. соггеаНо — соотношенне, связь) впервые прнме- 
нил Ж. Кювье в труде «Лекцин по сравнительной анатомин» (1806). Матема- 
тнческое обоснование метода измерения корреляции было дано в 1846 г, дру- 
гим французским ученым О. Браве. Обосновывая метод, Браве имел в внду 
«теорню ошибок в плоскости», перенося закон ошибок Гаусса на случаи двух 
переменных У н Х в область кристаллографии, которой он занимался. Раз- 
работка н примененне метода корреляции к измерению зависимости между 
бнологнческнмн признакамн былн сделаны Ф. Гальтоном и К. Пнрсоном. Галь- 
тону прннадлежнт и введенне термнна «корреляцня» в бнометрню (1886). 
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значения одной из них с соответствующими значениями другой. 
Если при увеличении одной переменной увеличивается другая, 
это указывает на положительную связь между этими величина- 
ми, и, наоборот, когда увеличение одной переменной сопровож- 
дается уменьшением значений другой, это указывает на отрица- 
тельную связь. Подобную взаимосвязь устанавливают при нали- 
чии однозначных отношений между переменными У и Х, когда 
речь идет о приращении или уменьшении функции по заданным 
значениям аргумента. Иная ситуация наблюдается в случае 
варьирующих признаков. Здесь приходится исследовать собст- 
венно не приращение или уменьшение функции, а сопряженную 
вариацию (ковариацию), выражая ее в виде взаимно связанных 
отклонений вариант от их средних у их. 

Ковариация (соо) есть усредненная величина произведений 
(х.—=) (и: —у) отклонений каждой пары наблюдений от их сред- 
них, т. е. соу== (1/п) [5 (х;—х) (у:—9)]. Очевидно, что величина 
этого показателя будет в значительной мере зависеть от того, 
насколько часто в общем ряду произведение (х;— 2) (0:—7) бу- 
дет иметь один знак — плюс или минус. В первом случае пары 
вариант должны отклоняться от своих средних в одном направ- 
лении (т. е. 2># и у:>>й или х:< и <). В другом случае, 
если х: >, то у:<У или наоборот. При этом преобладание вели- 
чин одного знака в принципе способствует большему абсолютно- 
му значению коэффициента ковариации, так как величины с раз- 
ными знаками в сумме дают меньшую абсолютную величину. 
Среднее значение всех произведений указывает, в какой мере 
бӧльшим (или меньшим) значениям х; соответствуют ббльшие 
(или меньшие) значения у. 

Недостаток коэффициента ковариации заключается в том, что 
этот коэффициент не учитывает случаи, когда коррелируемые 
признаки выражаются разными единицами измерения. Напри- 
мер, масса тела может коррелировать с его линейными размера- 
ми, длина колосьев — с массой содержащихся в них зерен ит. д. 
Недостаток, присущий ковариации, устраняется, если вместо 
отклонений (х:-—2) (и: —5) использовать их отношения к средним · 
квадратическим отклонениям 5х и ѕу. В результате получается 
показатель, который называют эмпирическим коэффициентом 
корреляции г: | 


п 
х х, (х, — х) ы-Я| 
а Су. (144) 


$х5у 


Коэффициент корреляции можно вычислить, не прибегая к 
расчету средених квадратических отклонений, что упрощает вы- 
числительную работу, по следующей аналогичной формуле: 
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п 
У (х х) (0—0) 

ИУ — х) 0—0)? | 

Коэффициент корреляции — отвлеченное число, лежащее в 
пределах от —1 до +1. При независимом варьировании призна- 
ков, когда связь между ними полностью отсутствует, г==0. Чем 
сильнее сопряженность между признаками, тем выше значение 
коэффициента корреляции. Следовательно, при |г|>0 этот по- 
казатель характеризует не только наличие, но и степень сопря- 
женности между признаками. При положительной или прямой 
связи, когда большим значениям одного признака соответствуют 
большие же значения другого, коэффициент корреляции имеет 
положительный знак и находится в пределах от 0 до +1, при 
отрицательной или обратной связи, когда большим значениям 
одного признака соответствуют меньшие значения другого, коэф- 
фициент корреляции сопровождается отрицательным знаком и 
находится в пределах от 0 до — 1. 

Коэффициент корреляции нашел широкое применение в 
практике, но он не является универсальным показателем корре- 
ляционных связей, так как способен характеризовать только ли- 
нейные связи, т. е. выражаемые уравнением линейной регрессии 
(см. гл. ІХ). При наличии нелинейной зависимости между 
‚ варьирующими признаками применяют другие показатели связи, 

о которых речь пойдет ниже. 

Вычисление коэффициента корреляции. Это вычисление про- 
изводят разными способами и по-разному в зависимости от чис- 
ла наблюдений (объема выборки). Рассмотрим отдельно специ- 
фику вычисления коэффициента корреляции при наличии мало- 
численных выборок и выборок большого объема. 

Малые выборки. При наличии малочисленных выборок 
коэффициент корреляции вычисляют непосредственно по значе- 
ниям сопряженных признаков, без предварительной группировки 
выборочных данных в вариационные ряды. Для этого служат при- 
веденные выше формулы (144) и (145). Более удобными, осо- 
бенно при наличии многозначных и дробных чисел, которыми 
выражаются отклонения вариант 2х; и и: от средних х и у, слу- 
жат следующие рабочие ры 


п > хи -> я > у 
Ип (5) Уп: — (0) 


У хи, 215и 
Е аа аі и 147 
а= УВ. ! 0 


Гу 


Гху == 
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р р, Р 
ЕЕ ЕР, (148 
2Ур,.5, 
где = (0) 22: (Ух!) 2[п; Ру==У (у:-—9У)?= 
==512:— (31:) пои Ра=ха?.—($а1)?/п. Здесь х; и у! — паг. 
ные варианты сопряженных признаков Х и У; Хи ў — средние 
арифметические; 4= (х;—у:) — разность между парными ва 
риантами сопряженных признаков Х и У; п-—- общее число паг 
ных наблюдений, или объем димерной выборочной совокупносте 


Таблица 9 


Масса тела гамадри- 
в-ма Й х. Масса тела дете- х х 2 
ло: а нышей У» КГ 19; . 1 У 


10,0 0,70 7,000 100,00 0,4900 
10,8 0,73 7,884 116,64 0,5329 
11,3 0,75 8,475 127,69 0,5625 
10,0 0,70 7,000 100,00 0,4900 
10,1 0,65 6,565 102,01 0,4225 
1111 0,65 7,215 123,21 0,4225 
11,3 0,70 7,910 197,69 0,4900 
10,2 0,61 6,222 104,04 0,3721 
13,5 0,70 9,450 182,25 0,4900 
12,3 0,63 7,749 151,29 0,3969 
14,5 0,70 10,150 210,25 0,4900 
11,0 0,65 7,150 121,00 0,4225 
12,0 0,72 8,640 144,00 0,5184 
11,8 0,69 8,142 139,24 0,4761 
13,4 0,78 10,452 179,56 0,6084 
11,4 0,70 7,980 129,96 0,4900 
12,0 0,60 7,200 144,00 0,3600 
15,6 0,85 13,260 243,36 0,7225 
13,0 0,80 10,400 169,00 0,6400 
12,1 0,75 9,075 146,41 0,5625 
Я==237,4 14,06 167,919 2861,60 9,9598 


Из этих формул следует, что для вычисления коэффициент: 
корреляции необходимо предварительно рассчитать величинь 
Ух, Ху, Уху, Ух и Уу?, а также (при использование 
формулы (146) еще и 74; (обязательно с учетом знаков!) + 
хаг. 

Пример 1. Изучали зависимость между массой тела гамадрь 
лов-матерей и их новорожденных детенышей. Под наблюдение» 
находилось 20 обезьян. Результаты наблюдений и их обработк: 
приведены в табл. 96. 


Определяем суммы квадратов отклонений (девиаты): О,= 
—2861,60— 20" 43.662; Р, -=9,9598 — 10 *—0,076. | 
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Подставляем эти величины в форм У, (147): гху= 
_ 167,919 — (1/20) (237,4-14,06) _ 167,919 — 166,8 1,027 0,564. 
А У43,662-0,076 /3,318 — 1,825 
Толученная величина (7х;==0,564) указывает на наличие поло- 
хительной средней силы корреляционной связи между массой 
`ела гамадрилов-матерей и массой тела их детенышей. 

Пример 2. На основании накопленных в хозяйстве данных о 
хирномолочности коров и их 12 одновозрастных дочерних особей 
ыла составлена следующая выборка (табл. 97). 


Таблица 97 
Процент жира в молоке 
Е дочерних хр ир «с-ш ар 
1 
3,10 3,65 9,6100 13,3225 0,55 0,3025 
3,17 3,11 10,0489 9,6721 —0,06 0,0036 
3,76 3,57 14,1376 12,7449 —0,19 0,0361 
3,61 3,61 13,0321 13,0321 =0,00 0,0000 
3,27 3,44 10,6929 11,8336 -+-0,17 0,0289 
3,61 3,71 13,0321 13,7641 --0,10 0,0100 
3,80 3,61 14,4400 13,0321 —0,19 0,0361 
3,65 3,98 13,3225 15,8404 --0,33 0,1089 
3,34 3,36 11,1556 11,2896 --0,02 0,0004 
3,65 3,89 13,3225 15,1321 +0,24 0,0576 
3,45 3,45 11,9025 11,9025 0,00 0,0000 
4,05 3,79 16, 4025 14,3641 —-0,26 0, ,0676 
У =:49,46 43,17 151,0992 155,9301 0,71 0,6517 


Вычислим коэффициент корреляции между жирномолоч- 
‹остью коров и их дочерних особей. Расчет вспомогательных 
зеличин, нужных для определения девиат, приведен в табл. 97. 
Гаходим значения девиат: о 0992— (42,46) 2/12 
= 151,0992—150,2376 0,8616; Р,= 155,9301—(43,17)2/12= 
= 155,9301—155,3041 = 0,6260; Ра==0,6517— (0,71) 2/12=0,6517— 
—0,0420=0,6097. Подставляем известные величины в формулу 
148): 

__0,8616 0,6260 — 0,6097 _ 0,8779 __0, раа 598, 


хи 9 у058616:0,6950 2 у0,53936 1,4688 


Хорреляция между жирномолочностью родительских особей и их 
тотомства у крупного рогатого скота оказалась положительной 
І довольно высокой. 

Эмпирический коэффициент корреляции, как и любой другой 
зыборочный показатель, служит оценкой своего генерального 
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параметра ри как величина случайная сопровождается 
ошибкой: 


1-72 
п—2 ° 


Отношение выборочного коэффициента корреляции к своей 
ошибке служит критерием для проверки нулевой гипотезы — 
предположения о том, что в генеральной совокупности этот по- 
казатель равен нулю, т. е. р=0. Нулевую гипотезу отвергают на 
принятом уровне значимости а, если 


п ~ 2 
рг р ==, Ы 25215. 


Значения критических точек &: для разных уровней значимости 
и чисел степеней свободы А=и— 2 приведены в табл. У Прило- 
жений. 

Так, значимость коэффициента корреляции между массой 
тела гамадрилов-матерей и их новорожденных детенышей оцени- 


$; = 


(149) 


вается следующим образом #,==0,564 и 20-2 —0,564 х 


1— (0,564)2 
х у 26,397 =0,564.5,138 2,90. 

В табл. У Приложений для #=20—2=18 и а=1% находим 
1..==2,88. Нулевую гипотезу отвергают на высоком уровне значи- 
мости (Р< 0,01). 

Достоверность выборочного коэффициента корреляции мож- 
но проверить по специальной таблице, в которой содержатся 
значения критических точек г», для уровней значимости 0==59% и 
а=1% с учетом числа степеней свободы А=и—2. Так, для 
&=18 и а=1$ в табл. ХУ! Приложений находим ғ: = 0,56. 

Установлено, что при обработке малочисленных выборок 
(особенно когда и<30) расчет коэффициента корреляции по 
приведенным выше формулам дает несколько заниженные оцен- 
ки генерального параметра р. В таких случаях лучшую оценку р 


получают при использовании поправки 1 | ‚ на кото- 
п — 
рую умножают эмпирический коэффициент корреляции, т. е. 
+ 1—2 
Гху=г, |1 |. 150 
ты | (180) 


Применим эту формулу к расчету коэффициента корреляции 
между жирномолочностью коров и их дочернего потомства 
(табл. 97). В данном случае объем выборки и= 12 и у= 0,598. 


Отсюда п—0,898 |1 ое |= 0.898-1,086— 0,620, Опре- 
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деляем критерий достоверности: 4=0,620 И. 
ГЕРЕ т" , 
= 0,620] 16,2 =0,620-4,0125==2,56. 

В табл. У Приложений для ё=12—2-=10 и а= 59% находим 
11==2,23. Так как 1ф==2,56>/,:==2,23, нулевую гипотезу отвер- 
гают на 5%-ном уровне значимости (0,01<Р<0,05). Этот вывод 
подтверждается и при оценке величины г,;* == 0,620 с помощью 
табл. ХХІ Приложений, в которой для 2==10 и а=5% находим 
Га == 0,58. 

2-преобразование Фишера. Правильное применение 
коэффициента корреляции предполагает нормальное распределе- 
ние двумерной совокупности со- 
пряженных значений случайных 
величин УиХ. Из математиче- 
ской статистики известно, что при 
наличии значительной корреляции 
между переменными величинами 
Хи? (7»,>0,5) выборочное рас- 
пределение коэффициента корре- 
ляции для большого числа малых 
выборок, взятых из нормально -05 0 +05 +1 
распределяющейся генеральной 
совокупности, значительно откло- м ооа Ын 
няется от нормальной кривой. Об ярки при л=12 для разных рв 
этом наглядно свидетельствует чений генерального параметра (р) 
рис. 24, на котором изображены (по А. К. Митропольскому, 1971) 
кривые распределения эмпириче- 
ского коэффициента корреляции при п=12 для значений гене- 
рального параметра р=0; 0,4 и 0,8. Видно, что при значениях р, 
приближающихся к единице, кривая распределения эмпириче- 
ского коэффициента корреляции становится все более асиммет- 
ричной. Следовательно, выборочный коэффициент корреляции не 
будет точной оценкой генерального параметра, если он вычис- 
лен на малочисленной выборке и его абсолютное значение пре- 
вышает 0,5. 

Учитывая это обстоятельство, Р. Фишер нашел более точный 
способ оценки генерального параметра по значению выборочно- 
го коэффициента корреляции. Этот способ сводится к замене 7Гхи 
преобразованной величиной 2, которая связана с эмпирическим 
коэффициентом корреляции следующим образом: 


= ш- №” или 2=1,15129 5-11”. 


2 1—7 1-— ғ 


Распределение величины = является почти неизменным по 
форме, так как мало зависит от объема выборки и от значения 
коэффициента корреляции в генеральной совокупности. Если 
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эмпирический коэффициент корреляции меняет свое значение от 
—1 до +1, то величина = меняет свое значение от —со до +оо, 


(рис. 25) со средним значением = п ат) 
1 


я 2 — 
и дисперсией 9 ==———. 
п — 


2]. 0 7 22 


Рис. 25. ее величины 2 при п=|12 (по 
. К. Митропольскому, 1971} 


Преобразование коэффициента корреляции в величину г про- 
изводят по специальной таблице (см. табл. ХХИ Приложений). 
В этой таблице содержатся величины 2, соответствующие значе- 
ниям эмпирического коэффициента корреляции г. Критерием 
достоверности показателя г является следующее отношение: 


= -2.-=2/үп 3. 
52 

Этот критерий используют в тех случаях, когда вместо коэф- 
фициента корреляции берут соответствующее ему число г. Нуле- 
вая гипотеза отвергается на принятом уровие значимости а и 
числе степеней свободы А—=и— 2. Значения критических точек #51 
приведены в табл. У Приложений. 

Применение 2-преобразования позволяет с большей уверен- 
ностью оценивать статистическую значимость выборочного коэф- 
фициента корреляции, а также и разность между эмпирическими 
коэффициентами корреляции гу —/==4,, когда в этом возникает 
необходимость. 

Проверим нулевую гипотезу в отношении 2-преобразованного 
коэффициента корреляции между жирномолочностью коров и их 
дочернего потомства, который с поправкой на малый объем вы- 
борки оказался равным г=0,620. В табл. ХХІІ Приложений для 
этой величины находится значение 2== 0,725, откуда критерий 


1,=0,725У 12—3=0,725.3,0=2,18. Эта величина оказывается 
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ниже критической точки #,=2,23 для Ё==12—2=10 и о=5% 
(см. табл. У Приложений). Следовательно, отвергнуть нулевую 
гипотезу на этом уровне значимости нельзя. Этот вывод не со- 
гласуется с ранее сделанным заключением о том, что г==0,620 
можно считать величиной достоверной на 5%-ном уровне значи- 
мости. 

Минимальный объем выборки для точной 
оценки коэффициента корреляции. Только что рас- 
смотренный пример показывает, с какой осторожностью следует 
делать заключение о статистической значимости выборочного 
коэффициента корреляции, вычисленного на малообъемных вы- 
борках. Очевидно, предпочтение в таких случаях следует отда- 
вать оценке г по преобразованной величине г. 

Можно рассчитать объем выборки для заданного значения 
коэффициента корреляции, который был бы достаточен для опро- 
вержения нулевой гипотезы (если корреляция между признака- 
ми Уи действительно существует). Для этого служит следую- 


щая формула: 


п=——- 3, (151) 


где п — искомый объем выборки; { — величина, заданная по при- 
нятому уровню значимости (лучше для 0==19%); 2 — преобразо- 
ванный эмпирический коэффициент корреляции. 

Так, в отношении только что рассмотренного примера для 
а=1%, которому соответствуют #=2,58; г== 0,598 и г==0,693, 
находим 


п (2258) 1 3—13,91-3==16,9==17. 
(0,693)2 

Это означает, что для окончательного решения вопроса о ста- 
тистической значимости эмпирического коэффициента корреля- 
ции между жирномолочностью коров и их дочернего потомства 
необходимо увеличить число наблюдений по меньшей мере до 
П==17. 

Большиевыборки. При наличии многочисленных исход- 
ных данных их приходится группировать в вариационные ряды 
и, построив корреляционную решетку, разносить по ее клеткам 
(ячейкам) общие частоты сопряженных рядов. Корреляционная 
решетка, как уже было показано в гл. УП, образуется пересече- 
нием строк и столбцов, число которых равно числу групп или 
классов коррелируемых рядов. Классы располагаются в верхней 
строке и в первом (слева) столбце корреляционной таблицы, 
а общие частоты, обозначаемые символом |„,,— в клетках кор- 
реляционной решетки, составляющей основную часть корреляци- 
онной таблицы. 
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Классы, помещаемые в верхней строке таблицы, обычно рас- 
полагаются слева направо в возрастающем порядке, а в первом 
столбце таблицы — сверху вниз в убывающем порядке. При та- 
ком расположении классов вариационных рядов их общие час- 
тоты (при наличии положительной связи между признаками Х 
и У) будут распределяться по клеткам решетки в виде эллипса 
по диагонали от нижнего левого угла к верхнему правому углу 
решетки или (при наличии отрицательной связи между призна- 
ками) в направлении от верхнего левого угла к нижнему право- 
му углу решетки. Если же частоты р, распределяются по клет- 

кам корреляционной 

Таблица 98 решетки более или 

менее равномерно, 

Объем выборки Значение К не образуя фигуры 
эллипса, это будет 
указывать на отсут- 


50>=п>30 К=1--3,32 18 п 

100>1>50 К=5 16 А Е ствие корреляции 
2002>п2> 100 К==716 п между признаками. 
3002> 022200 К=816п Распределение 


частот |, по клет- 

кам корреляционной 
решетки дает лишь общее представление о наличии или отсут- 
ствии связи между признаками. Судить о тесноте или силе связи, 
ее направлении можно более или менее точно лишь по значению 
и знаку коэффициента корреляции. При вычислении коэффициен- 
та корреляции с предварительной группировкой выборочных 
данных в интервальные вариационные ряды не следует брать 
слишком широкие классовые интервалы, Грубая группировка 
гораздо сильнее сказывается на значении коэффициента корре- 
ляции, чем это имеет место при вычислении средних величин и 
показателей вариации. 

Учитывая это обстоятельство, авторы известного руководства 
«Теория статистики» Дж. Юл и М. Кендэл (1960) рекомендуют 
избирать величину классового интервала не крупнее !/зо вариа- 
ционного размаха коррелируемых признаков, группировать ди- 
мерную совокупность наблюдений не менее чем в 15—25 клас- 
сов, Эта ценная рекомендация имеет, однако, один существенный 
недостаток: она не согласуется с объемом выборки, не учиты- 
вает то, что между числом классов и величиной классового ин- 
тервала А существует определенное соотношение, в общем виде 
оно выражается формулой (1), в которой знаменатель К нахо- 
дится в зависимости от объема выборки п. Опыт показал, что 
в области корреляционного анализа величину К можно поста- 
вить в зависимость от объема выборки примерно следующим 
образом (табл. 98). 

Эта таблица позволяет подойти к определению величины 
классового интервала дифференцированно в зависимости от 
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объема выборки, что важно в практической работе исследовате- 
ля, так как довольно часто приходится группировать сравни- 
тельно небольшие выборки (п=<50), что не учитывает рекомен- 
дация Юла — Кендэла '. 

Как и другие статистические характеристики, вычисляемые 
с предварительной группировкой исходных данных в вариацион- 
ные ряды, коэффициент корреляции определяют разными спосо- 
бами, дающими совершенно идентичные результаты. 

Способ произведений. Коэффициент корреляции можно вы- 
числить используя основные формулы (144) или (145), внеся 
в них поправку на повторяемость вариант в димерной совокуп- 
ности. При этом, упрощая символику, отклонения вариант от их 
средних обозначим через а, т. е. ах=(х:-—х) и а,==(у:—У). 
Тогда формула (145) с учетом повторяемости отклонений примет 
следующее выражение: 


К 
У, Ххчахау 
гау, (159) 


И Ў 7а? Ў ла? 


Очевидно, что для определения коэффициента корреляции этим 
способом необходимо предварительно рассчитать средние ариф- 
метические 2 и ў, а также величины Х,а, Ура?) и Урахау. 

Пример 3. При проведении осеннего кросса на 10-километро- 
вую дистанцию и лыжных гонок спортсменов на дистанцию 5 км 
были получены результаты, которые сведены в табл. 99. Эти дан- 
ные, выраженные в минутах, указывают на положительную зави- 
симость между переменными У и Х, где через У обозначены ре- 
зультаты лыжных гонок, а через Х — результаты 10-километро- 
вого кросса. 

Вычислим коэффициент корреляции для этих данных. Пред: 
варительно рассчитаем вспомогательные величины (см. «крылья» 
таблицы). Находим средние арифметические рядов Х и У: 
2 = Ух|.п = 2391/60=39,85 мин и ӱ=Хуѓ,/п = 1088/60 = 
= 18,13 мин. Умножая квадраты отклонений вариант от их сред- 
них на соответствующие частоты, получаем величины ѓ,а?, и 
Їуа?,. Например, величина ѓ;02;==26,52 получена следующим об- 


ї По данному вопросу существует и другое мнение. Согласно ему, един- 
ственным соображением, которое следует учнтывать прн построеннн корреля- 
цнонной таблнцы для вычнелнтельных целей, является возможность выигры- 
ша в объеме вычислений при сохраненин нх достаточной точностн. Этому тре- 
бованию удовлетворяет условне 15=<К=25, которое близко к рекомендации 
Д. Юла и М. Кендэла. При К>>25 объем вычислений по корреляцнонной таб- 
лнце необоснованно возрастает, не приводя к существенному повышению нх 
точности, прн К< 15 может значнтельно уменьшиться точность вычнсленнй. 
(Прим. ред.) 
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разом: в первой верхней строке корреляционной решетки нахс 
дятся и==1 и ах==5,15, откуда [ха?„==1-5,152==26,52 и т. д. 

Наибольшего внимания и усилий требует расчет значение 
Риаха,. Эти значения получаются в результате перемножени; 
частот {ху на соответствующие отклонения по рядам Уи: 
(обязательно с учетом знаков отклонений!). Например, величине 
Уриа,а, =40,68 получена следующим образом: 


2. (—1,85) : (—2,13) = 7,881 

2. (285) . (—2,13) =19,141 

2.(—4'85) - (—2,13) =20,662 

ах ву = 40,683 2 40,68 
Таблица 9 
у 

БЖ 16 `1 17 18 19 20 | 21 ?, хі, ч, | Ра, 
45 1 1 45 |--5,15| 26,52 
44 | І о | 88 |--4,15| 34,45 
43 1 2 1 2 6 | 258 |--3,15| 59,54 
49 1 1 з |2 7 | 294 |--2,15| 32,36 
41 12 1 3 1 7 | 287 |--1,15| 9,28 
40 3 4 1 8 | 320 |--0,15]| 0,18 
39 3 8 1 12 | 468 |—0,85] 8,67 
38 2 4 1 1 8 | 304 |—1,85| 27,38 
37 2 3 5 185 |—2,85| 40,61 
36 2 9 72 |—3,85| 29,65 
35 2 2 70 |—4,85 | 47,04 
і 6 17 16 10 6 5 60 | 2391 — 1315.66 


у, |9 [289 |288 |190 |120 |105 | 1088 
а, |—2.13| —113|-—0,13| --0,87| --1,87| --2,87| — 
ра, | 27.22| 21,71| 0,27| 751| 20,98] 41,18 118,93 
{хуахау | 40,68| 26,50] 0,21| 11,75] 27,86] 45,20] 152,20 


Аналогичным способом рассчитана следующая величин: 
Бахаи: 


2 15) • (—1,13) =—2,5990 
3 8 05585 —3,1075 
4 и 
• (—1,85) - (—1,13) = +8,3620 
3. (2.85) - (—1,13) =+9,6615 +29,6060 
2. (—3,85) + (—1,13) =+8,7010 


Биазау = 4-26,4985 2226,50 


и так далее, пока не будут определены все значения [ху@ха, коп- 
реляционной таблицы по столбцам или по ее строкам. Суммируя; 
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значения [х,аха,, получаем величину Хѓ,,а,2,= 152,20. Подстав- 
ляя известные величины в формулу, находим 


22 152,20 __ 152,20 
0 у315,66-118,93 193,70 


Это довольно высокий показатель связи между переменными Ү 
и Х. Достоверность этого показателя оценивается с помощью кри- 
терия Стьюдента, который представляет отношение выборочного 
коэффициента корреляции к своей ошибке, определяемой по 


формуле 


— 40,786. 


=. (153) 
Так, в данном случае г,;=0,786 и п=60. Ошибка 5,= 


1— (0,7862 
НИ 0080. Отсюда 1%-=0,786/0,080=9,83. Эта величи- 
на значительно превышает /,;==3,46 для Ё==58 и а=0,1% (см. 
табл. У Приложений), что опровергает Ну-гипотезу на высоком 
уровне значимости (Р< 0,001). 

Способ условных средних. При вычислении коэффициента 
корреляции отклонения вариант («классов») можно находить не 
только от средних арифметических Ӯ и ӯ, но и от условных сред- 
них Ах и Ау. При этом способе в числитель формулы (145) вно- 
сят поправку и формула приобретает следующий вид: 

К 
У) Рау — п 
гу (154) 


п5ҳ8у 


где [ху — частоты классов одного и другого рядов распределения; 
ах== (х4—Ах) [А и а, = (у:—Ау) 1А, т. е. отклонения классов от 
условных средних, отнесенные к величине классовых интервалов 
№; п — общее число парных наблюдений, или объем выборки; 
В.=Уј,а [п и 6,=Ура,/п — условные моменты первого поряд: 
ка, где ѓх — частоты ряда Х, а |, — частоты ряда У; $х и 5$, — 
средние квадратические отклонения рядов Х и Ү; они вычисля: 
ются по способу условных средних, но без умножения на величи- 
ну классового интервала А и без внесения поправки п/ (п—1). 

Способ условных средних имеет преимущество перед спосо- 
бом произведений, так как позволяет избегать операции с дроб- 
ными числами и придавать один и тот же (положительный) знак 
отклонениям ах и ау, что упрощает технику вычислительной ра- 
боты, особенно при наличии многозначных чисел. 

Пример 4. Воспользуемся только что рассмотренными дан- 
ными из примера 3 и вычислим коэффициент корреляции между 
результатами осеннего 10-километрового кросса и 5-километро- 
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вого пробега спортсменов. Как и в предыдущем случае, предвг- 
рительно рассчитываем вспомогательные величины (табл. 100, 

Подсчитав частоты ѓ; и }, по каждому ряду, намечаем услон 
ные средние А; и Ау. В качестве этих величин могут быть взять 
любые классовые варианты. Удобнее брать в качестве условны: 
средних А; и Ау значения первых (начальных) классов, тогда все 
отклонения ах и а, получают положительный знак. 


Таблица 10: 
у 
ЕЧ 16 17 18 19 20 21 Р, а, ах Р.а, 
45 1 1 10 10{ 100 
44 1 1 2 9 18| 162 
43 1 2 1 2 6 8 48| 384 
42 1 1 3 2 7 7 49| 343 
41 2 1 3 1 7 6 42| 252 
40 3 4 1 8 5 40| 200 
39 3 8 1 12 4 48| 192 
38 2 4 1 1 8 3 24| 72 
37 2 3 5 2 10| 20 
38 2 2 1 2 2 
35 2 2 0 0 0 
Ь 6 17 16 10 6 5 60 | — | —2911 1727 
ау | 0 | 1 | | ВУ а СЕ 2 
ац 0 | 17 | а | 


р Рау? 0 | 17 | 64 90 96 | 125 | 392 


2,059, 0 59 152 


ЕИ 
ЗЕЕ 
Е 

С 


186 | 176 е | 773 


В данном случае намечаем: А;==35 и А,==16. От этих услов- 
ных средних, где 2;==0 и а,=0, откладываем отклонения клас 
сов, как показано в табл. 100. Перемножая частоты рядов на о" 
клонения классов, находим [ках и [уау, а также ѓ,а,2 и ѓа. Зна 
чения [х,ахау рассчитываем так же, как и в предыдущем пример+ 
Так, величина [.,аха,==59 получена следующим образом: 


а 


ЕК 


В 
. 


1 
1 
1 
1 
Сумма =59 ит. д. , 
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)пределяем 6,=291/60=4,850 и Ь,==128/60=2,133, а также 
'редние квадратические отклонения: $; == У 1727/60 — (4,850) == 
=У 5,26=2,294 и з,==И 392/60— (2,133): ==У Т,984 == 1,408. 
Тодставляем известные величины в формулу (154) и определяем 
:оэффициент корреляции: 
773 — 60.4,850.2,133 152,30 
Ги 60.2,294.1,408 198680 о: 


Пример 5. Из Госплемкниги крупного рогатого скота горба- 
`овской породы была извлечена выборка, включающая 100 по- 
тарно связанных значений двух признаков — годового удоя пер- 
ютелок и коров по второму и третьему отелам и их масса тела 
табл. 101). 


Таблица 101 


Масса Удой, Масса Удой, Масса Удой, | Масса Удой, 
тела, Кг тела, кГ тела, кг тела, КГ 
кг кг кг кг 
327 2325 440 3219 287 1396 360 2696 
302 1761 405 1806 337 1819 324 2510 


342 2277 352 1832 306 1302 397 2023 
409 2784 295 2413 335 2372 405 2162 
311 1523 369 2625 341 2688 368 2403 
297 1838 444 2614 343 2131 418 2483 
364 1984 319 2297 411 2901 371 2016 
377 1775 303 1946 316 2151 382 2715 
358 2700 352 2278 314 1734 410 2878 
284 2241 344 2111 396 2537 443 2431 
314 1954 361 3082 339 1979 385 3048 
352 2046 303 2478 332 2142 285 1791 
387 2323 328 2801 328 1917 321 2554 
375 1710 344 2248 314 1873 351 2281 
311 1868 284 1085 409 2630 331 2292 
332 2166 295 2293 367 2100 355 2340 
262 1384 360 2282 396 2493 396 2609 
333 2288 244 1736 384 2632 390 2499 
381 2249 279 1446 356 2043 426 3013 
320 1520 303 2376 446 2358 430 2933 
295 2389 329 1937 338 2309 386 2682 
345 2012 323 1999 300 1442 331 1689 


Обозначим удой через Х, а массу тела коров — через У и вы- 
"ислим коэффициент корреляции между этими признаками, В 
:овокупности значений признаков находим минимальные и мак- 
‘имальные варианты: хшш==1085 и хшах==3219; Ушш==244 и 
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Утах==446. В этих границах намечаем классовые интервалы, при- 
нимая К==7: 


аа ОЕ ШЕВ арра дао и е Е. 


14 


А 14. 


Затем определяем нижние границы первых классов: хн==1085— 
—152/2==1009 и у„=244—14/2 ==237. Отсюда получаются следу- 
ющие классовые интервалы — по удою (7): 1009 — 1161 — 1313 — 
1465 — 1617 — 1769 — 1921 — 2073 — 2225—2377—2529 — 2681 — 
2833 — 2985 — 3137 — 3289; по массе коров (Х): 237 — 251 — 
265 — 279 — 293 — 307 — 321 — 335 — 349 — 363 — 377 — 391 — 
405 —419 — 433 — 447. В каждом ряду образуется по 15 классов, 
что отвечает рекомендации Юла — Кендэла и гарантирует доста- 


1 
масса 237— | 251— | 265— | 279 | 293— | 307. | 321— | э35-— 


коров Х| Цент- 250 | 264 | 278 | —292 | —306 | —320 | -334 | --348 
ральные 


значення | | —— 1——— 


3137—3288 | 3213 
2985—3136 | 3061 
2833—2984 | 2909 


2681—2832 | 2757 9 2 
2529—2680 | 9605 1 1 
2377—2528 | 2453 4 1 
2225—2376 | 2301 1 2 1 4 4 
2073—2224 | 9149 1 2 3 
1921—2072 | 1997 9 1 9 9 
1769—1920 | 1845 1 1 9 1 1 
1617—1768 | 1693 1 1 1 1 
1465—1616 | 1541 9 
1313—1464 | 1389 1 9 1 
1161—1312 | 1937 1 
1009—1160 | 1085 1 
ИЕН САА ЕРНЕК ИИ ЗЕНА ВИННИ: ИРНЕ Е 
Ї. | ав аи в 


ах 0 1 2 3 4 5 6 7 8 
Е 0 1 0 15 48 40 84 84 80 
„ах? 0 1 0 45 | 192 | 200 50 | 588 | 640 
Рухауах 9 0 51 | 304 | 205 | 648 | 644 | 679 


0 
Ўх 2149,0 |1389,0 1601,8 | 2047,7 | 1864,0 | 2257,6 |2250,3 | 2361,8 
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точную точность коэффициента корреляции, вычисляемого для 
этой выборки. 

Разграничиваем классы, уменьшая их верхние границы на 
единицу, строим (по числу классов) корреляционную таблицу и 
по ее клеткам разносим все 100 вариант данной выборочной со- 
вокупности. В результате получаем распределение общих частот 
(,) двух сопряженных рядов распределения Х и У (табл. 102). 

«Крылья» табл. 102 содержат расчет вспомогательных вели- 
чин, нужных для вычисления коэффициента корреляции спосо- 
бом условных средних. В качестве последних приняты наимень- 
шие классовые варианты, т. е. срединные значения классовых 
интервалов (А„==1085 и А,=244), для того чтобы все отклоне- 


Таблица 102 


349— | 363— | 377— | 391— | 405— | 419— | 433— 
—362 —376 | —390 | —404 | —418 | —432 | —446 


14] 14 | 196 | 440,0 


1 
1 1 1 3| 13| 39| 507 | 388,7 
2 1 13| 12| 36| 432 | 4167 
2 2 1 10| И 10 | 1210 | 367,2 
1 1 2 1 | 8| 10] 80| 800 | 3413 
1 1 І 2 | и 9] 99| 891 | 358,5 
4 2 19 8| 152 | 1216 | 342,7 
2 2 10 7| 70 | 490 | 357,0 
2 2 1 12 6] 72| 432 | 3420 
1 1 1 1 10 5] 50| 250 | 343,4 
1 5 4] 20 | 80 | 311,2 
2 31 6 | 18 | 314,0 
4 21 8| 16| 2825 
1 и 1 1 | 300,0 
1 0 0 0 | 286,0 
| : | Ј | | з |1 — | 757 | 6539 
= а 
91 юги 12 | 13| 14| – У АА - 2 — 1085 +. 
63 | 80 | 55 | 108 | 26 | 70 | 754 п 


567 | 800 | 605 11296 | 338 | 980 | 6756 757 _ , 
441 | 750 | 440 | 984 | 325 | 728 |61941 + 15200 = 2235,64 кг; 
2149,012510,0 |2301,012469,912985,0| 2665,8 Е 754 

х= 244 4+ 14-7007 = 349,56 кг 


1—1674 295 


ния классов от условиых средних (где эти отклонеиия равны иу- 
лю) имели положительный знак. 

Значеиия {хуа»ха, как и в предыдущих случаях, рассчитаиы 
перемиожеиием отклоиеиий классовых вариаит от условиых сред- 
иих иа соответствующие частоты }х,. Например, [х„аха,==51, что 
иаходится внизу табл. 102, получена так: 


Сумма=51 ит. д. 


Определяем условиые момеиты первого порядка: Ё;== 
=757/100==7,57 и 6,=754/100=7,54, а также средиие квадрати- 
ческие отклоиеиия: 5.== 6539/100—(7,57)2 =2,843 и 5,= 
=) 6756/100— (7,54 =3,272. Как и в предыдущих примерах, 
$х И 5, вычисляют без виесения поправочного коэффициеита 
п! (п—1) и ие умиожают на А, и Ау, так как эти величины входят 
и в числитель и в зиамеиатель формулы, взаимно сокращаясь. 

Определив величииы У{»уахаи, 6х и Ву, а также $; и 5у с учетом 
объема выборки == 100, иаходим значеиие коэффициента корре- 
ляции между этими призиаками: 


— 6194 — 100-7,57.7,54 _ 486,22 (роз 
Йе 100.2,843.3,272 930,23 и 


Полученная величина г», указывает на иаличие положительной 
средней силы связи между массой тела данной группы коров и 
их годовым удоем. 

Применим #-критерий для проверки Но-гипотезы в отноше- 
нии величииы Г»ху=0,523, Ошибка этого показателя $,= 


У 0.5287 0.7209 0085, Отсюда == 0:958 ==6,14. 
У 100 0,085 

В табл. У Приложеиий для Е=п—2==100—2==98 и уровня 
значимости и==0,1% иаходим #:==3,37. Поскольку ==6,14> 
>>3,37, имеются достаточиые осиоваиия для неприиятия нулевой 
гипотезы на высоком уровне значимости (Р< 0,001). 

Оценка разности между коэффициентами корреляции. При 
сравнении коэффициентов корреляции двух независимых выбо- 
рок нулевая гипотеза сводится к предположению о том, что в ге- 
неральной совокупиости разиица между этими показателями рав- 
на нулю. Иными словами, следует исходить из предположеиия, 
что разиица, наблюдаемая между сравниваемыми эмпирически- 
ми коэффициентами корреляции, возиикла случайио. 

Для проверкн этой (нулевой) гипотезы служит {-критерий 
Стьюдента, т. е. отношеиие разности между эмпирическими ко- 
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эффициентами корреляции г! и г: к своей статистической ошибке, 
определяемой по формуле 


а= ү 8-Я, (155) 


где 5», и $, — ошибки сравниваемых коэффициентов корреляции. 
УВА гипотеза опровергается при условии, что += 


А 
112}, для принятого уровня значимости а и числа сте- 


пеней бод Е = (п—2) (по—2) =п + п2—4. 

Пример 6. Сравнить коэффициенты г! ==0,762 и г.==0,603, вы- 
численные на независимых выборках п! =80 и п›=86. Разность 
между этими показателями 4 (,,-,) ==0,762 —0,603 =0,159. Что- 
бы оценить достоверность этой разности, нужно рассчитать ее 
статистическую ошибку. Предварительно находим квадраты оши- 
бок для каждого коэффициента корреляции: 


2 _ 1— (0,76)? _ 0,4194 . 
2 Н 00054; 
НН 0,0076. 


Переходим к определению ошибки разности (4,==и-— го). 


5== 0,0054: 0,0076 =0,114. Критернй достоверности = 
==0,159/0,114==1,39. Эта величина не превосходит критической 
точки #:==1,96 для &==80--86—4==162 и а=5% (см. табл. У 
Приложений), что не позволяет отвергнуть нулевую гипотезу. 

Известно, что более точную оценку достоверности коэффици- 
ента корреляции получают при переводе г», в число 2. Это свя- 
зано с особенностями распределения гу, которое не всегда следу- 
ет нормальному закону (см. рис. 25). Не является исключением 
и оценка разности между выборочными коэффициентами корре- 
ЛяЦии Г! И гә, особенно в тех случаях, когда последние вычислены 
на выборках сравнительно небольшого объема (п<100) и по свое- 
му абсолютному значению значительно превышают 0,50. 

Разность 21—22==4 оценивают с помощью {-критерия Стью: 
дента, который строят по отношению этой разности к своей ошиб- 
ке, вычисляемой по формуле 


И тето 189) 


Нулевую гипотезу отвергают, если, => >: для == 
а Р 


+ по—4 и принятого уровня значимости о. 
Так, оценку разности между г! ==0,762 и гг== 0,603 с переводом 
этих значений в числа 2; и 2: производят следующим образом. 
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В табл. ХХІІ Приложений для г; ==0,762 и г.=0,603 находим чис- 

ла 21=0,996 и 22=0,693, откуда і, Е слан СВИ 
у 1780 + 1/86 

Оа. О 05808 =— 3,95. Эта величина не превосходит крити 
И0,0241 0,155 ЗД р А р 


ческую точку Ё: = 1,96 для а=5%ф и &= 162, Следовательно, ну- 
левая гипотеза остается в силе; разница между сравниваемыми 
коэффициентами корреляции оказывается статистически недо- 
стоверной. 

Корреляционное отношение. Как было показано, коэффициент 
корреляции служит для измерения только линейной связи. Для 
измерения нелинейной зависимости между переменными Хи У 
используют предложенный К. Пирсоном показатель, который на- 
зывают корреляционным отношением. Если коэффициент корре- 
ляции характеризует связь между признаками с точки зрения 
прямой пропорциональности, то корреляционное отношение, обо- 
значаемое греческой буквой т (эта), описывает ее двусторонне. 
Поясним это на следующем примере. Возьмем ряд сопряженных 
(парных) значений двух переменных величин Х и У: 


Значения Х 2 4 6 8 4 4 2 6 
Значения У 4 8 8 7 6 10 6 12 


Ранжируем эти значения по Х: 


Х 2 2 4 4 6 6 6 8 
у 4 6 4 8 10 8 12 7 


Видно, что некоторые значения Х повторяются, что позволяет 
распределить эту выборку следующим образом: 


Х 2 4 6 8 
Ух 5 6 10 7 


Здесь 7» — частные или групповые средние из соответствующих 
значений переменной У. Например, значению х:=2 соответствует 
х= (4--6):2=5; значению х;==6 соответствует Их = (10+8- 
+12):3=10 ит.д. — 

Если же данную совокупность ранжировать по У, получается 
следующий результат: 


у 4 4 6 7 8 8 1 12 
Х 2 4 2 8 6 4 6 6 


Этот ряд состоит ие из четырех, как в первом случае, а из шести 
групп, представленных значениями переменной Ў =4; 6; 7; 8; 10; 
12, которым соответствуют следующие частные средние: 


ү 4 6 т в 10 12 
р: В. В. ВЕ. ВЕ 


Конструкция корреляционного отношения предполагает сопо- 
ставление двух видов вариации: изменчивости отдельных наблю- 
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дений по отношению к частным средним и вариации самих част- 
ных средних по сравнению с общей средней величиной. Чем мень- 
шую часть составит первый компонент по отношению ко второ- 
му, тем теснота связи окажется большей. В пределе, когда ника- 
кой вариации отдельных значений признака возле частных сред- 
них не будет наблюдаться, теснота связи окажется предельно 
большой. Аналогичным образом, при отсутствии изменчивости 
частных средних теснота связи окажется минимальной. Так как 
это соотношение вариации может быть рассмотрено для каждого 
из двух признаков, получается два показателя тесноты связи. 

Таким образом, связь между переменными случайными вели- 
чинами Хи Ү выражается по-разному в зависимости от того, по 
значениям какой величины ранжируется совокупность. Этот при- 
мер объясняет, почему корреляционное отношение характеризует 
связь между признаками Х и У двусторонне, т.е. У по Хи Х по У; 
отсюда два коэффициента этого показателя: йух и Иху. Коэффи- 
циент корреляции, как и корреляционное отношение,— величина 
относительная. Но в отличие от коэффициента корреляции кор- 
реляционное отношение всегда является величиной положитель- 
ной, способной принимать значения от 0 до 1. Коэффициент кор- 
реляции — равнозначная мера для обоих корреляционно связан- 
ных признаков Хи У, тогда как коэффициенты корреляционного 
отношения обычно не равиы друг другу, т. е. А».и=йЙу»х. Равенство 
между этими показателями осуществимо только при строго ли- 
нейной зависимости между признаками. Корреляционное отно- 
шение является универсальным показателем: оно позволяет ха- 
рактеризовать любую форму корреляционной связи — и линей- 
ную, и нелинейную. 

Коэффициенты корреляционного отношения Йху и йух опреде- 
ляют рассмотренными выше способами, т. е. способом произве- 
дений и способом условных средних. 

Способ произведений. Коэффициенты корреляцион- 
ного отношения У по Хи Х по У определяют по следующим фор- 


мулам: 
з? 52 
Вул=—0. и ЕА 2 , (157) 


К К 
1 — 1 ыы = 
55 к У (у, А Е Лу (х, — х)? — группо- 
К 


~. 
1 
ГА 


К 
1 – 1 = 
вые, а = Ул, (0—0) и = УЛ д) — общие 
1=1 іт] 


дисперсии. Нетрудно заметить, что величина п входит и в числи: 
тель, и в знаменатель. А поскольку она взаимно сокращается, ко- 
эффициенты корреляционного отношения можно представить в 
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виде корня из отношений групповых девиат к общим девиатам, 
т. е. 


у ХА р р Хи 
ЗВ ху © 
Ули Хой 


Здесь у и Х — общие, а ух и Жу — групповые средние арифметиче- 
ские; |, — частоты ряда 7, а }, — частоты ряда Х. 

Следовательно, чтобы вычислить корреляционное отношение 
У по Х или Х по У описываемым способом, необходимо: 1) сгруп- 
пировать первичные данные в форме корреляционной таблицы; 
2) определить общие (ӯ и Х) и групповые (ух и ху) средние ариф- 
метические; 3) возвести в квадрат отклонения групповых средних 
от общей средней данного ряда распределения, умножить на 
соответствующие частоты ѓ; и результаты сложить; 4) умножить 
суммы квадратов отклонений классовых вариант от их средних 
на частоты этих отклонений и результаты сложить; 5) подставить 
полученные данные в формулу (158} и рассчитать корреляцион- 
ное отношение У по Х или Х по У, а по необходимости и оба эти 
показателя. 

Пример 7. Определить корреляционное отношение годового 
удоя У коров горбатовской породы по массе их тела Х. Сначала 
находим среднюю арифметическую годового удоя коров у, а за- 
тем и групповые средние ух. Необходимые данные помещены в 


табл. 103: А-а, 27388 1085-4158 727. =2235,64 кг. 
п 
Групповые средние ў; представляют суммы произведений груп- 


(158) 


Йух 


Х 
244 | 258 |272] 286 300 зм 328 342 356 
у 
3213 
3061 1 
2909 
2757 2 2 2 
2605 1 1 
2453 4 1 
3201 1 2 1 4 4 4 
2149 1 2 3 
1997 2 1 2 2 2 
1845 1 1 2 1 І 1 
1693 1 1 1 1 
1541 1 2 
1389 2 1 
1237 1 
1085 1 
ї. 2 1 |0 5 12 8 14 12 10 
у, | 2149,00] 1389,00 0 | 1601,80] 2047,67] 1864,00] 2257,57| 850,33] 2361,80 
уу | 86,64] 846,64] 0| 633,84] 187,971 371,64] 21,931 14,69] 126,16 
(и. | 15013,0] 716799,3 | 0 | 2008765,7! 423992,7 | 1104930,3] 6732,9 | 2589,6 | 159163,5 
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повых частот {„, ряда Х на соответствующие срединные значения 
классовых интервалов, отнесенные к сумме частот данного ин- 
тервала по другому ряду ѓ;. Например, частная средняя Ух== 
—2149,00, что находится в первом столбце табл. 103, получена 
умножением частот {х,, расположенных в этом столбце корреля- 
ционной решетки, на соответствующие срединные значения клас- 
совых интервалов (ряд Х) с последующим делением суммы на 
Ь=2, т.е. ух = (1.1693--1.2605) /2=2149,00 ит. д. 

Определив групповые средние, находим разности между ними 
и общей средней у данного ряда, а также разности между отдель- · 
ными классовыми вариантами у; и общей средней у, которые воз- 
водим в квадрат и умножаем на соответствующие частоты рядов 
распределения. Полученные результаты суммируем. Описанные 
операции помещены в табл. 103. 

Подставляя найденные величины Хѓ, (ўх—7)? и Х|,(и:-—У)? в 
формулу (158), определяем корреляционное отношение годового 
удоя коров У по массе их тела Х: 


2 7656205,8 _үу=т5 
һу ЕТ =70,410==0,640. 


Таким же образом рассчитываем и корреляционное отношение 
Х по У, т. е. массы тела коров по их годовому удою: йху==0,581 
(читателю предлагается рассчитать эту величину). 

Способ условных средних. Определяя коэффициенты 
корреляционного отношения по формулам (157), отклонения 
классовых вариант х; и у; можно брать не только от средних 


Таблица 103 


370 384 398 412 426 440 | Р, уги | Бу 
1 1 977 954 529 

1 1 3 82 2041 875 

2 1 3 673 1 358 787 

2 1 1 10 521 2714 410 

1 1 2 1 1 8 369 1 089 288 

1 1 1 2 1 Ц 217 517 979 

2 1 19 65 802 

2 10 87 75 690 

2 2 12 239 685 452 

1 10 391 1 528 810 

1 1 1 1 5 543 1 474 245 

2 695 966 050 

4 847 2 869 636 

1 999 998 001 

1 1151 1 324 801 

7 8 5 9 2 5 100 2 1 18679 828 
2149,00] 2510,00] 2301,00] 2469,89] 2985,00] 2665,80 рр" 


86,64 274,36 65,36 234,25 749,36 430,16 — 
52545,4 | 602187,3: 21359,6 | 493857,6 | 1123080,8| 925188,1 | 7656205,8 
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“ Я ‹ АША 
в'еое |929 |909 |109 (0° |ту 10 оет [е9 12 |18 |9 |879 |0 ос х=) 
Рич и 061+ (8+ [61+ 10 |ва [84 101-1 аг |8— |81 |0 јо [0 | о 
оо [98 182 |985 (08 [ал [вс |ог (о |»: [се [801 |08 [0 [9 [86 | 20%] 
рее | 121-9 [об вач (вт [01 [0 [ви | эт [98— |0 |0 |9— [01—] 0° 
2 шв [9+ [94 ее [5+ а о |1 |а | | || р 


стч16е |198 118-1 1оот 19 2 |6 | |3 |2 ог [а т ів [а | |0 р |5 =] 
0091 | |6 | 2-11 | 3807 
00:6 | $-19% | 9— 19— |1 1651 
955 [11-1001 | 05— |9— |# А | 6851 
008 |758 | 8— |7— |5 1 $ 1981 
06% | 11—199 |91— |е— |9 І т |5 | 691 
ого | 1-0 | 06— |2— (01 ‚и те НЕЕ 3781 
000 |0 |51 | 51| |21 1 еее м. 2661 
00°от 101410 |0 (0 [от |т 5 $ ев 1 6715 
3009 | 161 |6ет+ [1+ |61 |1 Я У т 1085 
9'9т ет? [22+ |2 |1 | 1 А г 5 | $95 
егое (11-1 |+ |+ |8 |1 5 | : і | у І 3095 
ет‘9е |8т-+1о9т | 0$- |+-+ |01 1 т А - с 80 19/5 
ее"8 |от-Нел [91-194 | 6065 
ее'ее 101-|801 |81 [9+ |8 1 $ | І 190 
00:6Ӯ | Нбр [2+ (1+ | етсе 


в, |х 
ро) вз, о | вр | п; | 0 | 957 | оте | 866] 986 | оле | 996 | 58| все Е | 006 | 985 515 | 88| 995 4 


рот епнгде1 
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арифметических х и у, но и от условных средних хт и у. В таких 
случаях групповые и общие девиаты рассчитывают по формулам 


(Ган? (7 у) 
р„= У, миф н, и Ра а также, 


(>: уау)? 
п 


н, =). 


В развернутом виде формулы (157) выглядят следующим об- 


разом: 
(7 = )? (>: Хуа)? 
һу [7а 


(7 а (Ў 7а,)? 
„у (У © ча аа-а р,. (159) 


п 


В этих формулах а,== РВ; А, и ах== (Х:—Ах) [Ах — отклонения 
классов от условных средних, сокращенные на величину классо- 
вых интервалов; значения а, и 2; выражаются числами натураль- 
ного ряда: 0, 1, 2, 3, 4, ... . Остальные символы объяснены выше. 

Пример 8. Рассчитать способом условных средних корреляци- 
онное отношение между удоем У и массой тела Х и между массой 
тела и годовым удоем коров горбатовской породы. Расчет вспо- 
могательных величин, необходимых для вычисления коэффици- 
ентов корреляционного отношения й;у и йух, приведен в табл. 104. 

Значения [хуау и ѓ,уах рассчитывают так же, как и при вычис- 
лении коэффициента корреляции. Например, величина ѓ,.„0;== 
==—-18 (табл. 104) получена перемножением частот |», на соот- 
ветствующие отклонения а; ряда Х, а именно: 


т р 
1. (—2) = 

2. (—5) = 0 
1. (—7) =—7 


Сумма=— 18 ит. д. 


Остальные действия понятны из табл. 104. 

Закончив расчет вспомогательных величин, переходим к оп- 
ределению общих и групповых девиат: р,=1100—542/100== 
=1100—29,16 =1070,846; ШО.=841—542/100 =841—32,49=808,51; 
Ру. =391,15—29,16==361,99; Г, „= 363,80—32,49 =331,31. Подстав- 
ляем эти величины в формулы: 


һу 09 59_._у0,338—0,581; һу аиа 


1070,84 
= /0,410— 0,640. Получился такой же результат, что и выше. 
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Сравнивая способ произведений со способом условных средних, 
нельзя не заметить преимущество первого способа, особенно в 
тех случаях, когда приходится иметь дело с многозначными чис- 
лами. Как и другие выборочные показатели, корреляционное от- 
ношение является оценкой своего генерального параметра и, как 
величина случайная, сопровождается ошибкой, определяемой по 
формуле 


==. (160) 


Достоверность оценки корреляционного отношения можно прове- 
рить по {-критерию Стьюдента или Ё-критерию Фишера. Но-гипо- 
теза исходит из предположения, что генеральный параметр равен 


5, 


0,581 1/1002 —? 
нулю. Так, в приведенном выше примере == 
У 1 (0,581) 
—=- 5792 —7,07>> 3,37 для Ё==п--2==98 и а==0,1% (см. табл. 
0,662 


У Приложений), что позволяет отвергнуть /,-гипотезу на 
0,1% -ном уровне значимости (Р< 0,001). 

К такому же выводу приводит и проверка Ло-гипотезы по 

#2 №—а 
Е-критерию Фишера: Ё тра ТАВ М — объем вы- 
борки, а число классов вариационного ряда. Именно: Ёф== 
В о ЕЕ. Зоне 
1 — (0,5812 15-2 8,61 

—2==13 (см. табл. УГ Приложений по горизонтали); .==/А-—@== 
=100—15=85 (см. в той же таблице первый столбец по верти- 
кали). Нулевую гипотезу отвергают на 0,1%-ном уровне значи- 
мости (Р<0,001). Следовательно, можно считать доказанным, 
что между годовым удоем У и массой тела Х коров горбатовской 
породы существует положительная связь. 

Коэффициенты детерминации. Для истолкования значений, 
принимаемых показателями тесноты корреляционной связи, ис- 
пользуют так называемые коэффициейты детерминации, которые 
показывают, какая доля вариации одного признака зависит от 
варьирования другого признака. При наличии линейной связи 
коэффициентом детерминации служит квадрат коэффициента 
корреляции /2х,, а при нелинейной зависимости между признака- 
ми Уи Х — квадрат корреляционного отношения И?ух. Так, коэф- 
фициент детерминации между массой тела коров Х и их годовым 
удоем У составляет 72, (0,523) 20,274, или 27,49%. Это озна- 
чает, что лишь 27,4% вариации признака Х определяется варьи- 
рованием признака 7. 

Корреляционное отношение является универсальным показа- 
телем корреляционных связей, поэтому в качестве коэффициента 
детерминации обычно применяют квадрат корреляционного отно- 
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щения. Именно корреляционное отношение между массой тела ко- 
ров Х и их годовым удоем У составляет й,„==0,581 (см. выше). 
Отсюда й2,„= (0,581) 20,338, или 33,8%. 

Коэффициенты детерминации дают основание построить сле- 
дующую примерную шкалу, позволяющую судить о тесноте связи 
между признаками: при г=0,5-—0,6 связь считается средней; 
г<0,5 указывает на слабую связь и лишь при 7220,7 можно судить 
о сильной связи, когда около 50% вариации признака У зависит 
от вариации признака Х. Разумеется, шкала эта весьма условна, 
но она необходима при сравнительной оценке показателей кор- 
реляционных связей. 

Можно показать, что коэффициенты детерминации имеют 
прямое отношение к показателям силы влияния факторов на ре- 
зультативный признак. Это особенно хорошо видно на примере 
вычисления коэффициента детерминации /2,„== (0,581)2==0,388, 
или 33,8,{ и показателя силы влияния, определяемого по методу 
Плохинского. Так, если массу тела коров Х рассматривать как 
фактор, воздействующий на их годовой удой Ү, то сила влияния 
этого фактора на результативный признак Х определяется сле- 
дующим образом: используя данные табл. 104, находим Н== 


=542/100==29,16. Девиаты: у= У /ау – Н = 1100— 29,16 = 


2 
1070,84; 0,=-07390? Г 391,15—29,16—361,99; Р, 
х 

= ),— Р), =708,85. Отсюда показатель силы влияния (по Плохин- 
р, 391,15 

пе ЗЕВСА В 
р, 1070,84 

теля равны друг другу. 

Тот же показатель, определяемый по методу Снедекора (чита- 
телю предлагается вычислить его), оказывается равным 0,247, 
или 24,7%. Эта величина оказалась близкой к квадрату коэффи- 
циента корреляции (72,х==0,274). Как и следовало ожидать, по- 
казатель силы влияния, вычисленный по методу Плохинского, 
оказался выше, чем тот же показатель, вычисленный по методу 
Снедекора. Преимущество метода Плохинского заключается в 
его универсальности и в простоте вычисления по сравнению с по- 
казателем силы влияния, определяемым по методу Снедекора '. 

Оценка формы связи. При строго линейной зависимости меж- 
ду переменными величинами Уи Х осуществляется равенство 
Йух==Йху. В таких случаях коэффициенты корреляционного отно- 
шения совпадают со значением коэффициента корреляции. Со- 
впадут при этом по своему значению и коэффициенты детерми- 
нации, т. е. А?2,=:/2,у. Следовательно, по разности между этими 


скому) № = =0,338, или 33,8%, т. е. оба показа- 


1 Следует, впрочем, помиить о том, что показатель силы влияиия факто- 
ра коиструкции Плохинского отличается смещениостью своих опенок по отно- 
шеинию к генеральиому параметру. (Прил. ред.) 
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величинами можно судить о форме корреляционной зависимости 
между переменными Үи Х: 


у= 02 — г2, (161) 


Очевидно, при линейной связи между переменными У и Х показа- 
тель ү будет равен нулю; если же связь между переменными Уи 
Х нелинейна, то у>0. 

Показатель ү является оценкой генерального параметра и, как 
величина случайная, нуждается в проверке достоверности. При 
этом исходят из предположения (Но) о том, что связь между ве- 
личинами Уи Х линейна. Проверить эту гипотезу позволяет 
Е-критерий Фишера: 


АЕ: 
| 1-12 а—2 


где а — численность групп, или классов вариационного ряда; М — 
объем выборки. Нулевую гипотезу отвергают, если Рф> Ё,; для 
Е =а—2 (находят по горизонтали табл. УГ Приложений), А2= 
—/М№-—а (находят в первом столбце той же таблицы) и принятого 
уровня значимости о. 

Применим Р-критерий для проверки гипотезы о линейной за- 
висимости массы тела Х от годового удоя У коров горбатовской 
породы. Исходные данные: М=100; й,„=0,581; И?,„=0,338, чис- 
ло классов вариационного ряда п=15. Отсюда 


0,338 —0,274 100—15 0,064.85 _ 5,44 
1 —0,338 15 —2 0,662.13 8,606 


Следует иметь в виду, что Р-критерий не универсален и не во 
всех случаях пригоден для получения вполне надежной инфор- 
мации о форме связи между коррелируемыми признаками. Поэто- 
му наряду с Е-критерием Фишера при проверке гипотезы о фор- 
ме связи между переменными величинами применяют довольно 
простой и строгий критерий Блекмана: В = № (2—1?) =11,37. 

При наличии линейной связи этот показатель не превышает 
11,37. Если же связь между признаками нелинейна, то М№(#?— 
— 72) > 11,37. Так, применительно к рассмотренному выше приме- 
ру о связи между массой тела Х и годовым удоем Ү коров горба- 
товской породы имеем —А;;= 0,581 и И2,,= 0,338; гу 0,523; 
25у= 0,274, а также №М=100 и а=15 (см. табл. 104). Отсюда 
Ву =100(0,338—0,274) =100.0,064=6,40< 11,37, что подтверж- 
дает гипотезу о линейной зависимости между этими призна- 
ками. 

Другой результат получается при проверке гилотезы о форме 
связи между годовым удоем У и массой тела Х коров той же по- 
роды. Так, применение Е-критерия Фишера приводит к следую- 
щему результату: 
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Е — ©,640)—0,24_ 85 _ 0,410—0,274 85 _ 
Ф 1 — (0,640)? 13 10,410 13 — 


11,526 
т < Е,,==1,82 
для Ё,==13, Е2=85 и а= 594. Это означает, что гипотезу о линей- 
ной связи между этими признаками не учитывать нельзя. 

Однако применение критерия Блекмана приводит к иному ре- 
зультату: В, = 100(0,410—-0,274) =100-0,136 = 13,60> 11,37, что 
не подтверждает вывод о линейности связи Ү и Х. Итак, два спо- 
соба проверки — два противоположных результата. Какой же из 
них ближе к истине? Ответить на этот вопрос позволит более 
точный метод дисперсионного анализа (см. гл. ІХ). 


У1!.2. НЕПАРАМЕТРИЧЕСКИЕ ПОКАЗАТЕЛИ СВЯЗИ 


Коэффициеит корреляции Фехиера. Наряду с параметриче- 
скими показателями для измерения корреляционной зависимо- 
сти между признаками применяют и непараметрические показа- 
тели. Одним из них является коэффициент корреляции, предло- 
женный Г. Фехнером (1897): 


„С-Н 
Ф С+Н 


Этот показатель основан на учете знаков отклонений вариант 
от их средних арифметических. Здесь С — число совпадений оди- 
наковых, как положительных, так и отрицательных, знаков раз- 
ностей (х,—Х) и (0:—7у), а Н — число несовпадающих знаков. 

Как и пирсоновский коэффициент корреляции Гу», основанный 
на учете не знаков отклонений, а их абсолютных значений, коэф- 
фициент корреляции Фехнера может принимать значения от —1 
до +1. При положительной корреляции он имеет положительный, 
а при отрицательной — отрицательный знак. 

Применяя коэффициент корреляции Фехнера, следует иметь 
в виду, что по сравнению с параметрическими показателями не- 
параметрические являются лишь приближенными оценками свя- 
зи. Поэтому вычисление последних можно ограничивать сотыми 
долями единицы. Также нужно иметь в виду то, что закон рас- 
пределения коэффициента корреляции Фехнера неизвестен, по- 
этому вопрос об оценке достоверности гх остается открытым. 

Пример 9. В табл. 97 содержатся данные о содержании жира 
в молоке коров и их дочернего потомства. Воспользуемся этими 
данными и вычислим (по Фехнеру) коэффициент корреляции 
между жирномолочностью сравниваемых животных. Сначала иа- 
ходим средние арифметические жирномолочности коров #== 
=42,46/12= 3,54 и их дочерних особей у=43,17/12=3,60 (табл. 
105). 


(162) 
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Затем подсчитываем число совпадающих и несовпадающи:г 
знаков, которыми отмечены разности между значениями вариан” 
и их средними арифметическими. Число совпадающих, как полс 
жительных, так и отрицательных, знаков оказывается равным. 
С==10, а число несовпадающих знаков Н 2. Отсюда коэффици- 
ент корреляции ғ == (10—2)/(10+2) = 0,667 = 0,58. Этот показа 
тель оказался несколько выше, чем пирсоновский коэффициент 
корреляции (/ху== 0,620). 


Таблица 107 


Процент жира в молоке Отклонения от средних 
Номера А т 
наблюдений 087покодения х | поколения и о (0) и: 
1 3,10 3,65 — + 
2 3,17 3,11 — — 
3 3,76 3,57 + — 
4 3,61 3,61 + + 
5 3,27 3,44 == — 
6 3,61 3,71 + + 
7 3,80 3,61. + + 
8 3,65 3,98 + + 
9 3,34 3,36 — — 
10 3,65 3,89 + + 
11 3,45 3,45 — — 
12 4,05 3,79 + + 
Сумма 42,46 43,17 


Пример 10. Вычислим коэффициент корреляции Фехнера меж- 
ду годовыми удоями тех же коров материнского поколения и и: 
одновозрастного потомства. Необходимые данные и их обработк: 
приведены в табл. 106. 

Средние арифметические: х==42696/12==3558,00; у= 
=45639/12 =3903,25. В данном случае число совпадающих знг 
ков С=8, а число несовпадающих знаков Н=4. Отсюда += 
== (8—4)/(8+4) =0,33. Следовательно, можно утверждать, чт 
между годовым удоем коров материнского поколения и иг 
одновозрастного потомства существует более слабая связь, чех 
в отношении жирномолочности между теми же группами кс 

ов. 
н Коэффициент корреляции рангов. Из непараметрических по 
казателей связи наиболее широкое применение нашел коэффици- 
ент корреляции рангов, предложенный К. Спирменом (1904): 


В НВ (163 


В п (п? — 1) : 
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де 4=^А„—Ю, — разность между рангами сопряженных значе- 
ий признаков Х и Ү; п — число парных членов ряда, или объем 
зыборки!. 

В основу конструкции этого показателя положены весьма про- 
тые соображения. Ранжируя попарно связанные значения при- 
:наков, можно видеть, как они распределяются относительно 
руг друга. Если возрастающим значениям одного признака Х 
‘оответствуют возрастающие значения другого У, то между ними 
‘уществует положительная связь. Если же при возрастании зна- 
'ений одного признака значения другого последовательно умень- 
чаются, это указывает на наличие отрицательной связи между 
ими. При отсутствии корреляции ранжированным значениям 
‚дного признака будут соответствовать самые различные значе- 
1ия другого. 


Таблица 106 


Годовые удои коров, кг 


материнского дочернего (х;—х) (0:—5) 
поколения Х поколения У 
3770 2 991 + — 
3817 4593 Б + 
2 450 3 529 — — 
3463 4274 — + 
3 500 3103 — — 
5544 3949 + + 
2112 3 491 — == 
3 150 3559 — =. 
3118 2916 — — 
3018 4 580 — + 
4291 4510 + + 
3 463 4 144 — + 
У==42 696 45 639 — — 


Обозначив ранжированные значения признаков порядковыми 
числами 1, 2, 3, 4, .., нетрудно определить ранги этих значений 
4 по их разности судить о степени зависимости одного признака 
т изменений другого. Очевидно, при полной связи ранги кор- 
зелируемых признаков совпадут и разность между ними будет 
завна нулю. В таких случаях коэффициент корреляции рангов 
кажется равным единице. Если же признаки варьируют неза- 


+ Эквивалентная формула коэффициента корреляцин рангов: 


з Г42АхКи 
тат] 


5—7 п-1 [п(п +1) 


0+0. 
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6 42 
п (п? — 1) 
корреляции рангов будет равен нулю. Таким образом, как и пир- 
соновский коэффициент корреляции и коэффициент корреляции 
Фехнера, коэффициент корреляции рангов выражается в долях 
единицы и может принимать значения от —1 до +1, т. е. сопро- 
вождается положительным или отрицательным зиаком. 

Как и другие выборочные показатели, эмпирический коэффи- 
циент корреляции рангов служит оценкой генерального парамет- 
ра рз и, как величина случайная, меняет свои значения при по- 
вторных выборках вариант из одной и той же генеральной сово- 
купности. Значимость этого показателя, имеющего распределе- 
ние со средней р5==0 и дисперсней 206 И — 1), оценивают пу- 


тем сравнения выборочного коэффициента г с критической точ- 
КОЙ г, которую можно определить по формуле 


меса К 
я ( 5) 


где п — объем выборки; ѓ и т — величины, связанные с уровнем 
значимости а следующим образом: для а==5% #==1,96 и т==0,16; 
для а= 19 #=2,58 и т= 0,69. Нулевую гипотезу отвергают, ес- 
ли эмпирически найденная величина гз превзойдет или окажется 
равной критическому значению гз; для принятого уровня значи- 
мости а и объема выборки п. Чтобы каждый раз не рассчитывать 
критические точки г,:, составлена специальная таблица, которая 
приводится в Приложениях (см. табл. ХХІІІ). 

Приведенный способ оценки значимости выборочного хз не 
единственный. При п>10 значимость эмпирического коэффици- 
ента корреляции рангов можно оценить с помощью {критерия 
Стьюдента, т. е. по отношению этого показателя к своей стати- 


висимо друг от друга, то величина ==1, и коэффициент 


. п — 2 
стической ошибке ф= "у = 2, для и—2 и принятого 
Гы 
$ 
уровня значимости (а). Рассмотрим применение гз на конкретных 
примерах. 


Пример 11. Изучали зависимость между массой живого тела 
и содержанием гемоглобина (по Сали) в крови павианов-гамад- 
рилов. Результаты наблюдений и их обработка приведены в 
табл. 107. 

Если бы отдельные члены ряда не повторялись, их рангами 
были бы порядковые числа. Но так как некоторые варианты по- 
вторяются, их рангами будут средние арифметические из соот- 
ветствующих чисел натурального ряда. У одинаковых членов ря- 
да должны быть и одинаковые ранги. Так, в ряду Х вариаиты 18 
и 19 повторяются дважды и их ранги равны полусуммам соот- 
ветствующих порядковых чисел: (2+3)/2==2,5 и (4-5)/2==4,5 


240 


г т. д. В последнем столбце табл. 107 показан расчет рангов для 
тленов ряда У. 

Если ранги рассчитаны правильно, их суммы должны быть 
здинаковыми, т. е. ,= №, и Х4==0. Если же Х45—0, следует ис- 
‹ать ошибку в присвоении рангов или в их разностях. Поэтому, 
трежде чем рассчитывать >42, следует проверить Х 4, которая дол- 
хна быть равна нулю. Так, в данном примере Р,=55 и Ю,==55, 
Ха = +9—9==0, что указывает на отсутствие ошибки в расче- 
ге рангов. Подставляя Х42=54,00 в формулу (163), находим 


о 03-5060. 


10 (102 — 1) 990 
Таблица 107 
Раиги рядов Расчет раигов У 
Номера Масса Х, " К.-К, 2 
исследо: ов У т они а а 
й 
ваии А, в, у А, 
1 17 70 1 1 0,0 0,00 70 1 
2 18 74 2,5 З —0,5 0,25 72 2 
3 18 78 2,5 7 —4,5 20,25 74 3 
4 19 72 4,5 2 +2,5 6,25 76 4 
5 19 77 4,5 5,5 | —1,0 1,00 77 5,5 
6 20 76 6 4 +2,0 4,00 77 5,5 
7 21 88 7 10 —3,0 9,00 78 7 
8 22 80 8 8 0,0 0,00 80 8 
9 23 77 9 5,5 - 3,5 12,25 86 9 
10 25 86 10 9 +1,0 1,00 88 10 
Сумма | — | 55 | 55 | 0,0 | 54,00 | = | == 


Толученная величина (0,67) превосходит критическую точку 
0,64) для п== 10 и 5%-ного уровня значимости (см. табл. ХХШ 
Триложений), что позволяет отвергнуть нулевую гипотезу 
0,01<Р< 0,05). К такому же выводу приводит и оценка значи- 
тости Г; =0,67 по величине {-критерия Стьюдента: 


0,67и10—2 0,67.2,83 1.896 о 57 
а ея , 
1 — (0,67)2 0,551 0,742 


В табл. У Приложений =п—2=8 и а=59 находим Ё; = 
=2,23. Так как ф>Ёь нулевую гипотезу отвергают на 5%-ном 
'ровне значимости. Следовательно, с вероятностью Р2>0,95 мож- 
о утверждать, что между массой тела и количеством гемоглоби- 
‹а в крови у павианов-гамадрилов существует положительная 
‹орреляционная связь. 
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Рассчитывая коэффициент корреляции рангов, следует иметь 
в виду, что на его значении сказывается наличие групп с одинё 
ковыми рангами, и тем сильнее, чем больше таких групп сред: 
сопряженных значений признаков Х и У. Чтобы получить более 
или менее точную оценку генерального параметра рѕ, нужно пр; 
наличии указанных групп вносить поправку в формулу (163, 
Эту поправку, обозначаемую буквой Т, прибавляют к числителк 
формулы, т. е. 


*— Иоан а (163а 


Ге == 
5 п(л2—1) ’ 


где Т=У,-НУ,, а И, — поправка для одного признака (ряд Х) 
У, — для другого (ряд У). Для определения И; и У, составленг 
специальная таблица, в которой / обозначает число групп с одг 
наковыми рангами, а і — число рангов в этих группах (табл. 108) 


Таблица 10: 


Так, в отношении только что рассмотренного примера (табл 
107) в ряду Х — две группы с одинаковыми рангами, т. е. [= 
в каждой группе — по два ранга, т. е. #=2. В табл. 108 для этогс 
ряда находим Үх=1,0. В ряду У— одна группа с одинаковымг 
рангами, т. е. /—=1; в ней два ранга, т. е. #=2. В табл. 108 дл; 
ряда У находим У,==0,5. Всего Г==1,0--0,5==1,5. Эту поправк: 
вносим в формулу (163) и определяем коэффициент корреляци» 
рангов: 


1—8 р 825,5 1 0,329 0,671 ==0,67, 
10 (102 — 1) 990 
В данном случае число групп с одинаковыми вариантами неве 
лико, поэтому поправка практически не сказалась на величине гє 
Пример 12. Воспользуемся данными табл. 105 и вычислим ко 
эффициент корреляции рангов между жирномолочностью короғ 
материнской линии и их дочернего потомства. Предварительнс 
освободимся от дробей, уменьшив каждую варианту на три едь 
ницы и умножив сотые доли на 100. Тогда вместо 3,10 получих 
10, вместо 3,65—65 и т. д. Такое преобразование чисел никак н= 
скажется на конечном результате, а вычисление У4? значительн‹ 
упростится (табл. 109). 
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Как и в предыдущем примере, здесь поправка Т=1,5, откуда 


о о 
: 12 (122 — 1) 1 1716 1 0,452 =0,548 = 0,55. 


Эта величина (0,55) для п==12 и а=5% не превосходит крити- 
ческую точку (0,58) (см. табл. ХХІ Приложений). Такой же ре- 
зультат дает оценка гз==0,55 по величине {-критерия Стьюдента: 


2—2 =_= 
Ёр== 0,55 И Е: ==0,55У 14,3=0,55.3,76 =2,08. 
Эта величина не превосходит критическую точку #:=2,23 для 
Е==12—2==10 и а=5% (см. табл. У Приложений). Обе оценки не 
дают основания для отвергания нулевой гипотезы. Полученный 
результат не согласуется с оценкой пирсоновского коэффициента 
корреляции (7ху== 0,598), который оказался статистически зна- 
чимым на 5%-ном уровне (0,01<Р< 0,05). 


Таблица 109 


Оо» Ранги рядов 
н Е 
иселело- а а? 
ваии материн- 
ЕЕ Хх "осори" & " 
1 10 65 1 8 —7 49,00 
2 17 П 2 1 +1 1,00 
3 27 44 3 З 0 0,00 
4 34 36 4 2 +2 4,00 
5 45 45 5 4 +1 1,00 
6 61 71 6,5 9 —2,5 6,25 
7 61 61 6,5 6,5 0 0,00 
8 65 98 8,5 12 —3,5 12,25 
9 65 89 8,5 1 —2,5 6, 
10 76 57 10 5 5 25,00 
П 80 61 11 6,5 - 4,5 20,25 
12 105 79 12 10 +? 4,00 
Сумма — | — | 78 | 78 | 0 | 129,0 


Какому показателю следует отдать предпочтение? Ответ на 
этот вопрос не может быть однозначным. Дело в том, что пара- 
метрический пирсоновский коэффициент корреляции достаточно 
точно характеризует линейную связь, когда коррелируемые при- 
знаки Х и У имеют нормальное или лог-нормальное распределе- 
ние, т. е. такое, при котором не сама случайная величина, а ло- 
гарифмы ее значений распределяются нормально. Примеры та- 
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кого рода приведены в гл. ІХ. Коэффициент корреляции рангов 
характеризует корреляционную связь независимо от закона рас- 
пределения. И все же, если коррелируемые признаки распреде- 
ляются нормально, предпочтение следует отдавать пирсоновско- 
му коэффициенту корреляции, как более мощному показателю 
связи между переменными У и Х по сравнению с коэффициентом 
Спирмена. В тех случаях, когда коррелируемые признаки не рас- 
пределяются нормально, следует исследовать непараметрические 
показатели связи. 


Коэффициент ранговой корреляции Спирмена и другие непа- 
раметрические показатели независимы от закона распределения, 
и в этом их большая ценность. Они позволяют измерять тесноту 
сопряженности между такими признаками, которые не поддаются 
непосредственному измерению, но могут быть выражены баллами 
или другими условными единицами, позволяющими ранжировать 
выборку. Ценность коэффициента корреляции рангов заключает- 
ся также в том, что он позволяет быстро оценивать взаимосвязь 
между признаками независимо от закона распределения. 

Коэффициент ассоциации. Тесноту связи между качественны- 
ми признаками У и Х, группируемыми в четырехпольную корре- 
ляционную таблицу, измеряют с помощью коэффициента ассоци- 
ации, или тетрахорического показателя связи, предложенного 
К. Пирсоном в 1901 г. В простейшем виде формула, по которой 
рассчитывают этот показатель, обозначаемый символом Гл, вы- 
глядит следующим образом: 


ай — Бс 


тосты жити чазаа земал: зите. ттт ШР 164 
У@ +5) С +4) (а +с) (6 а) Ив 


ГА 


Здесь а, 6, си а — численности коррелируемых групп (вариант), 

распределяемых по клеткам четырехпольной таблицы. 
Коэффициент ассоциации, как и другие подобные показатели, 

имеет прямое отношение к пирсоновскому критерию 2, на кото- 


ром он основан; в данном случаегд= | у2/и. Коэффициент ассо- 
циации, как и пирсоновский коэффициент корреляции, изменяет- 
ся от —1 до +1. Значимость выборочного коэффициента ассоциа- 
ции оценивают по величине критерия Пирсона 72. Нулевая гипо- 
теза сводится к предположению, что в генеральной совокупности 
этот показатель рд равен нулю. Но-гипотезу отвергают, если у2== 
==? А >52:: для принятого уровня значимости (а) и числа сте- 
пеней свободы == (2—1) (2—1) =1. 

Значимость гл можно проверить и с помощью #-критерия 
Стьюдента. Нулевую гипотезу отвергают, если 
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хля принятого уровня значимостн (а) и числа степеней свободы 
== 1—0. 

Пример 13. От скрещивания самцов плодовой мушки дрозо- 
оилы, имеющих окраску тела и зачаточные крылья (рецессивные 
тризнаки), с нормальными самками того же вида, гетерозигот- 
ыми по генам этих признаков, в потомстве оказались мухи: 


Серые с нормальнымн крыльямн ............. 75 
Серые с зачаточными крыльями .. .......... 16 
Черные с нормальными крыльямн............. 14 
Черные с зачаточными крыльями....... с... 68 


Выяснить, имеется ли связь между окраской тела и развитием 
<рыльев у дрозофилы. Группируем эти данные и подсчитываем 
‘'исленность мух по столбцам и строкам четырехпольной таблицы 
‚табл. 110). 


Таблица 110 


Крылья У 


Окраска тела Х Сумма 


иормальные зачаточиые 


Серая а=75 6=16 а+5 =91 
Чериая =14 4=68 с--4=82 


Сумма | а--с=89 | $--4=84 п==173 


Подставляя известные значения в формулу (164), находим 
= РЕ == 4876 22, 4876 —0,653. 
у 89.84-91.82 755 785 912 7469 


Ранее было показано, что распределение вероятных значений 
:ритерия %? является непрерывным (см. рис. 22). Качественные 
хе признаки дискретны, их числовые значения не распределяют- 
:я непрерывно. Учитывая эту особенность, в формулу (164) при- 
лято вносить поправку Йейтса на непрерывность вариации, рав- 
ую половине объема выборки. Эту поправку вычитают из раз- 
тости (002—0с), и формула (164) принимает следующий вид: 


— (1 аа —5|)—0,5п (165) 
Иа +0) (+4) (а с) (6 а) ° 


Трименим эту формулу к только что рассмотренному примеру: 


ГА 


(15-68 — 14-16) —0,5.173 _ 47895 _ (641, 


245 


Полученная величина указывает на наличие тесной связи между 
окраской тела и развитием крыльев у дрозофилы. Значимость 
этого показателя (у2ф== 173 (0,641)2=71,08) значительно превы- 
шает критический уровень %2,;= 10,83 для а=0,1% и А==1 (см. 
табл. УП Приложений). К такому же заключению приводит и 
оценка достоверности (значимости) коэффициента гд==0,641 по 
величине {-критерия Стьюдента: 


оби Е 173 —2 _ оби р т. 171 
1 — (0,641)? 0,589 — 


0,641 У 290,3 =0,641.17,0838 == 10,92. 


В табл. У Приложений для А==173—2==171 и а==0,14 находим 
1:==3,37. Так как >, нулевая гипотеза опровергается на вы- 
соком уровне значимости (Р< 0,001). Следовательно, с вероят- 
ностью Р=99% ію можно считать доказанным наличие тесной связи 
между окраской тела и развитием крыльев у дрозофилы. 

Коэффициент ассоциации Юла. Этот непараметрический по- 
казатель связи между качественными признаками, группируемы- 
ми в четырехпольную таблицу, определяют по формуле 


__ аа — Б 


ть. (166) 


Как величина случайная, коэффициент ассоциации Юла сопро- 
вождается статистической ошибкой 


1—5 


„р +2. (167) 


В формулах (166) и (167) символы а, 6, си 4 имеют то же зна- 
чение, что и в формуле (164). Достоверность этого выборочного 
показателя проверяют по величине ѓ-критерия Стьюдента. Вычис- 
лим го для данных из примера 13. Необходимые данные содер- 
жатся в табл. 110: 

75.68 — 14.16 5100 —224 4876 __ 


— 15.68 +- 14.16 5100 +294 — 5324 


Полученная величина (го==0,916), как и можно было ожидать, 
значительно выше той, которая была найдена ранее [см. форму- 
лу (164)], что связано с конструкцией коэффициента ассоциации 
Юла. Находим ошибку этого. показателя: 


- | 
—__1-— (0,916)? а о р В 

Ба 9 |е Е 
= 70 У0,1599—0,0805-0,40 —0,032. 
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Отсюда #ф==0,916/0,032=28,6. Для Е==173—2==171 и а=0,1%' 
критическая точка і; = 3,37 (см. табл. У Приложений). Нулевая 
гипотеза отвергается на 0,1%-ном уровне значимости (Р<0,001), 
что подтверждает сделанный выше вывод о наличии связи между 
окраской тела и развитием крыльев у дрозофилы. 

Коэффициент взаимной сопряженности. Для определения сте- 
пени сопряженности между качественными признаками с числами 
вариант, большими двух, служит коэффициент взаимной сопря- 
женности или полихорический показатель связи, предложенный 


К. Пирсоном: 
с ру и 
с Ет о (168) 
п у? 
где е у т —1 — величина, в которой [у обозна- 
пе х у 


чает частоты в клетках многопольной корреляционной таблицы, 
а Ур и Ў, — суммы частот по строкам и столбцам той же таб- 
лицы; М№== У, + У — общая сумма частот, или объем выборки. 

Пирсоновский коэффициент взаимной сопряженности (С) 
имеет один существенный недостаток: его значение значительно 
зависит от количества вариант коррелируемых качественных 
признаков. 

Учитывая этот недостаток, А. А. Чупров внес поправки в фор- 
мулу (168), которые приняли следующие выражения: 


Еа. оо. МЫ 
А № (п. = 1) (п, 1) И (п — 1) (пу — 1) | 9) 
Здесь К — коэффициент взаимной сопряженности Чупрова; пх и 
пу — численность групп по строкам и столбцам многопольной таб- 
лицы; № — объем выборки. Остальные символы объяснены выше. 
Нулевую гипотезу отвергают, если 72% =М№Мф? >52: для принятого 
уровня значимости и числа степеней свободы 
Пример 14. Изучали зависимость между цветом волос и цве- 
том глаз у человека. Результаты наблюдений сведены в табл. 111. 
Определим коэффициент взаимной сопряженности между 
этими признаками, предварительно рассчитав величину $?: 


802 52 702 


2— асаре ры терта 
6 255.308 т 255.572 т 255.20 гБ 230.308 Р 230.572 + 
82 682 3402 72 
п 611,205 — 10,205, 
7 230.20 Т 415.308 Е 415.308 г 415.20 


Подставляем известные значения в формулу (169): 


0,205 0,205 
== = ы ==0,226. 
Б и 35—080 А 4 
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Найденная величина К==0,226 указывает на наличие слабог 
связи между цветом глаз и цветом волос у человека. Критерий 
2 = Мф? =900.0,205 = 184,5 >> 2: =18,47 для а=0,1% и Е== (3— 
—1) (3—1) =4. Так как ҳ2ф> 2з, нулевая гипотеза отвергается нг 
весьма высоком уровне значимости (Р< 0,001). 

Необходимо помнить, что правильное применение критерия 
ҳ2 основано на требовании, чтобы в клетках корреляционно» 
таблицы содержалось не менее пяти вариант и чтобы общее чи‹ 
ло наблюдений не было меньше 50. Несоблюдение этих требовг 


Таблица 11 
Я Цвет волос 
Цвет глаз Всего 
блондины шатеиы рыжие 

Голубые 170 | 80 Г [ав 255 
Серые 70 152 230 
Карие 68 340 | 415 
Всего 308 | 572 |2 15 


ний не гарантирует получение достаточно точных оценок гене- 
рального параметра р,2, а следовательно, и правильных выводоєЕ 
которые делают на основании выборочных показателей, 

`Коэффициент корреляции знаков. Иногда коррелируемые пре 
знаки выражают не числами, а знаками: наличие признака — зна 
ком плюс, отсутствие — знаком минус. Такие случаи встречаются 
например, в психоло-педагогических исследованиях, когда выяс 
няют зависимость между поведенческими признаками. Для ИЗМе 
рения корреляции между такими признаками предложена фор- 
мула 


ОЕЕО дъ (170 
ИР(Х)Р(У)(1 Р(Х) (1 Р(У)) 


где Р(ХУ)— число совпадений положительных знаков в обще; 
серии испытаний, отнесенное к их числу п, т. е. Р(ХҮ) = У (+ )/= 
Р(Х) и Р(Ү) — частости положительных знаков для каждого пре 
знака отдельно, т. е. Р(Х) = Хх (+) /п и Р(У) =Ху (+) [п. 

Коэффициент корреляции знаков принимает значения от нулғ 
до единицы. Чем сильнее связь между признаками, тем этот пс 
казатель ближе к единице, и, наоборот, чем слабее зависимост. 
одного признака от другого, тем меньше будет и коэффициен” 
корреляции знаков. 

Пример 15. Изучали зависимость между увлеченностью зна 
ниями Х и склонностью учащихся к математике У. Под набліодє 
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= 


1ием находилось десять мальчиков (и==10). Результаты наблю- 
{ений приведены в табл. 112. 

В этой таблице наличие признака обозначено положительным, 
‹ отсутствие — отрицательным знаком. Общее число совпадений 
оложительных знаков Р (ХУ) =4/10==0,4; частости для каждого 
гризнака в отдельности Р(Х) =6/10=0,6 и Р(У) =5/10-=0,5; раз- 
пости: 1-—0,6=0,4 и 1—0,5=0,5. Подставляем известные значе- 
1ия в формулу (170): 

0,4 —0,6.0,5 0,10 0,100 
Ву = 


=0,408 — 0,41. 


У5,6:0,5.0,4:0,5 0,6 0,245 
Таблица 112 


Номера исследуемых 


ТЕ 


+ => — 


Число 
+ 


с 


6 7 


оо 


сл о 


+ |+ 
+ риа 


+ + + 
– | + +++ 


Пример 16. Выясняли зависимость между упрямством детей 
х и строгостью требований родителей У. Под наблюдением на- 
`одилось 15 учащихся и их родителей из разных семей. Резуль- 
“аты наблюдений приведены в табл. 113. 


Таблица 113 


Номера испытуемых 


При- 


Число 
знаки і 


8 т 


3 данном случае Р(ХУ)=5/15=0,33; Р(Х) =7/15==0,47 и 
(У) ==6/15=0,40. Отсюда | 
0,33 —0,47.0,40 0,142 0,142 
== —— == ы ‚==0, 8 . 
Кху ү0,47-0,40:0,53:0,69 (0,06 0,245 980 


Если еравнивать первый результат со вторым, то можно ска: 
‘ать, что в первом случае сопряженность между признаками 
тесколько слабее, чем во втором. 

Бисериальный коэффициент корреляции. Для измерения тес- 
ты связи между качественными признаками с двумя вариан: 
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тами и количественными признаками используют бисериальные 
коэффициент корреляции 


А хр = х2 1112 
агаа И | (171 


где #1 и Хх. — средние арифметические из отдельных значений 
альтернативных групп с их объемами п: и й; М=(т4п2) — 
общее число наблюдений, или объем выборки; 5; — среднее 
квадратическое отклонение для всей выборки. 

Бисериальный коэффициент корреляции изменяется от — 
до +1; при ==: он равен нулю. Знак для этого показателя 
не имеет, однако, смыслового значения. 


Таблица 114 


Пол подростков 


Показаиия Ё=—ж——— 
эстезиометра Р, 
Х, мм мужской жеиский 


Рх, пх 


Сл соко Фо оо Уго бл 


омм мюмюм№- 
осмон | мо | | = 
Со Со М 4 5. Ф К М М № С 

М ло к оосо со со со О 


> м 


© лоо о Ф ооо 
и 
> 
Ф 
> 


з 
| 
Ея 
сә 
К 
| 
5. 
© 
= 
| 
Г 
оо 
сл 


Сумма 


Значимость выборочного гь; оценивают по величине {-крите- 
рия Стьюдента с числом степеней свободы &==М—2 и прини 
маемым уровнем значимости. 

Пример 17. Изучали зависимость между полом подросткоЕ 
16—17-летнего возраста и их тактильной чувствительностьк, 
Единицей признака служило расстояние между ножками эс 
тезиометра, при котором ощущение двух прикосновений к ков 
цу среднего пальца левой руки воспринималось как одно при 
косновение, т. е. сливалось. Результаты опыта и расчет вспо- 
могательных величин приведены в табл. 114. 

Вычислим коэффициент корреляции между этими призна- 
ками; начнем с определения средних арифметических для жеь 
ской (ж) и мужской (м) групп: Хж== (1/15) (5-1,54-2-1,6--2> 
ЖЬ7-+ 1. 18-1. 1,9-2.2,0--1.2,1 + 1.2,5) = 26,4/15 == 1,76 мм 
Ям == (1/13) (1,5--1,8--1,9-2.2,0--2,2--2.2,3 + 3.2,4 + 2.2,5) = 
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=28,2/13==2,17 мм. Затем определяем среднее квадратическое 
отклонение: тля сли. == [109,96 — 
(54,6)? | 3,49 


т ое и $. =0,36. 


Подставляем найденные величины в формулу (171); 


2,17 — 1,76 13. 1315. 0,41.0,598 0,208 
0578 
е, 0,36 И 28.27 0,36 0,36 0 
Критерий достоверности ОЗ С: 3,61. Эта 


у 100,578) 0,816 

величина превосходит критический уровень &:=1% для а == 0,01 
и &==28——2-==26. Нулевая гипотеза отвергается на 1%-ном уров- 
не значимости (0,001<Р<<0,01). Можно считать установлен- 
ным, что между полом подростков и тактильной чувствитель- 
ностью конца среднего пальца левой руки существует опреде- 
ленная связь: девушки оказываются более чувствительными к 
прикосновению эстезиометра, чем юноши того же возраста. 


У111.3. МНОЖЕСТВЕННАЯ И ЧАСТНАЯ КОРРЕЛЯЦИЯ 


Множественная корреляция. Наряду с анализом двумерных 
совокупностей в биологии широкое применение находит стати- 
стический анализ многомерных корреляционных связей. Про- 
стейшим случаем множественной корреляции является зависи- 
мость между тремя признаками: Х, У и 1. Тесноту связи одно- 
го из них (Х) с двумя другими признаками (Уи 2) измеряют 
с помощью коэффициента множественной корреляции: 


ег 
п У книги, ху х2 сла хгГуг р (172) 


1—2 


ГДЕ Гху» Гхг И Гуг — коэффициенты линейной корреляции между 
парами признаков Хи У, Хи 7, Үн 2. 

Коэффициент множественной корреляции принимает значе- 
ния от нуля до единицы (0<г=<1). Значимость этого совокуп- 
ного показателя корреляции оценивают по величине {-критерия 
Стьюдента с числом степеней свободы =и—3 и принятым 
уровнем значимости. 

Пример 18. Из снопа озимой ржи случайным способом было 
отобрано 10 колосьев. Затем измерили длину каждого колоса 
Х, подсчитали число колосков У и количество зерен 7 в каж- 
дом колосе. Собранные данные и их первичная обработка при- 
ведены в табл. 115. 

Чтобы определить коэффициент множественной корреляции 
между этими признаками, необходимо сначала рассчитать пар- 
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иые коэффициеиты корреляции. Используя итоги табл. 115, нг 
ходим суммы квадратов отклоиений вариаит от их средни 
арифметических, т. е. девиаты: 


Ух х) У) 2 — (Хх) п == 34 469 — 5752/10 == 
—34 469 — 33062,5 == 1406,5; 


Уи =У 0 — (У уп = 2891 — 1652/10=2891 —2722,5—168,5 
У (2—2) = 21—(У 22/1 = 9456 — 2942/10 =9456 — 8643,6 == 


==812,4. 
Таблица 117 
х | у 2 х? | ү | л ХҮ Ү2 Х2 
70 18 36 4900 324 | 1296 | 1260 648 2520 
60 17 29 3600 289 841 1020 493 1740 
70 22 40 4900 484 | 1600 | 1540 880 2800 
46 10 12 2116 100 144 460 120 552 
58 16 31 3364 256 961 928 496 1798 
69 18 32 4761 324 | 1024 | 1242 576 2208 
32 9 13 1024 81 169 288 117 416 
62 18 35 3844 | 394 | 1295 | 1116 630 2170 
46 15 30 2116 | 225 900 90 450 1380 
62 22 36 3844 | 484 1296 | 1364 792 2232 
575 | 165 | 294 | зао 2891 | 9456 | 9908 | 5202 | 17816 


Отсюда 5,==У 1406,5/10 =11,86; 5,==У 168,5/10 == 4,10; $.= 
—)/812,4/10. Затем рассчитываем величииы сопряжеииой вг 
риации: 


(0—0) (хх) = ух Ху Ў х/п= 
9908 575.165/10—420,5; 
Ў (0,0) (2—2) = уг — Му Ў гіпа 
—5202 — 165.294/10— 351,0; 
У (х,—х) (2—2) = хе – Ўх У 2]п= 
—17816—575-294/10—911,0. 
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Наконец, определяем парные коэффициенты корреляции: 


Е 20, 420,5 
Пра Уи 0) х) 4905 _ __0,865; 
5453 10.11,86.4,10 486,3 
У (и — 0) (2: — 2) 351,0 351,0 
гу Ао 0,950; 
ы П5у5: 10.4,10.9,01 36+,4 
ТЕЕ У, (хх) (1—2) =: 911,0 911,0 0,853, 
05.5: 10.11,86-9,01 1068 ,6 
Подставляем известные величины в формулу (172): 
и 0,8652 0,8532 —2-0,865-0,853.0,950 
Гуго) = И - 
1 — (0,950)? 
у 0,0739 10,758 —0,871. 
0,0975 
А 0,871 10 3 2 304 2,304 
итерий достоверности ян н а а А 
Критерий д р $ У! © у 0,241 0,491 


= 4,69; {= 3,50 для 6= 10—3=7 и а= 19% (см. табл. У Приложе- 
ний). Нулевая гипотеза отвергается на 19%-ном уровне значи- 
мости (0,001<<Р<<0,01). 

Частная корреляция. Если известна связь между признаками 
Х, Уи 2, можно определить частные или парциальные коэффи- 
циенты корреляции, показывающие корреляционную зависи- 
мость между двумя варьирующими признаками при постоянной 
величине третьего признака. Для определения частного коэффи- 
циента корреляции между признаками Х и Ү при постоянной 
величине признака 2 применяют формулу 


Гху — ГхгГуг (173) 


ву ==. 
ы И (1-2,) (1 2,) 


Заключение знака 4 в скобки обозначает, что влияние призна- 
ка 7 на корреляцию между Х и У исключено. 

Соответственно формула для определения частного коэффи- 
циента корреляции между признаками Х и 2 при исключении 
влияния на эту связь признака У будет выглядеть так: 


АЙ, (174) 
И (1—3) (1—2) 

И наконец, частный коэффициент корреляции между признака- 
ми Уи при постоянной величине признака Х определяется 


по формуле 


Гку(у) = 


Гу? ху! хг - , (175) 
У(! —7 и) (1 — 5.) 


Гуг(х) = 
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Рассчитаем частные коэффициенты корреляции для выборки 
из примера 18: 


9.865 —0.858.0,950 _ 0,055 0.05 (зад, 
аи) г — 0,8532) (1 —0,9502) 70,07 0,164 “`’ 
0.853 —0,865.0,950__ _ 0.032 0,091 0000, 
и — (1 — 0,8652) (1 — 0,9502) 00,094 05 "о 
0,950 —0,865-0,8 0,212 0,212 
ПИРЕ 50 65.0,853 — 0.212 0 309 


Наиболее высоким оказался коэффициент корреляции между 
числом колосков У и количеством зерен в колосьях 2 при ис- 
ключенном влиянии на эту связь признака Х, т. е. длины ко- 
лосьев. 


Крнтерий достоверности #= 0,809 р 02, 7 


—_ „—} 
х И 23,15=0,809.4,81 =3,89. Эта величина превосходит критиче- 
скую точку =3,36 для =10—2=8 н а=!% (см. табл. У 
Приложений). Нулевая гипотеза отвергается на 1%-ном уров- 
не значимости (Р< 0,01). 

Рассмотренные коэффициенты множественной и частной кор- 
реляции применяют лишь для измерения линейных связей. Ана- 
лиз множественных нелинейных связей описан в специальной 
литературе. 2 


ГЛАВА 1Х 
РЕГРЕССИОННЫЙ АНАЛИЗ 


Понятие регрессии. Зависимость между переменными вели- 
чинами Х и Ү может быть описана разными способами. В част- 
ности, любую форму связи можно выразить уравиеиием обще- 
го вида у= (х), где у рассматривают в качестве зависимой 
переменной, или функции от другой — независимой переменной 
величины х, вазываемой аргументом. Соответствие между ар- 
гументом и функцией может быть задано таблицей, формулой, 
графиком и т. д. Изменение функции в зависимостн от измене- 
ний одного или нескольких аргументов иазывается регрессией', 


1 Термин «регрессня» (от лат. гертеѕѕіо — двнженне назад) ввел в бноло- 
гню Ф. Гальтон, нзучавший наследованне колнчественных прнзнаков. Он об- 
наружил, что потомство высокорослых н низкорослых родителей возвращается 
(регресснрует) на {/з в сторону среднего уровня этого признака в данной по- 
пуляцни. С развнтнем бнометрин этот термин утратнл свое буквальное зиа- 
чение и стал применяться для обозиачення н корреляционной зависимости 
между переменными величннами У и Х, 
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Весь арсенал средств, применяемых для описания корреляцион- 
ных связей, составляет содержание регрессионного анализа. 

Как было показано в гл. УП, отличие статистической связи 
от функциональной заключается в том, что в последнем случае 
между аргументом и функцией существует однозначное соот- 
ветствие, т. е. каждому определенному значению аргумента х 
соответствует определенное значение функции у=(х). При 
статистической связи разным значениям одной переменной со- 
ответствуют различные распределения другой переменной, в 
которых могут быть найдены частные средние #,. Поэтому 
форма статистической связи можег быть описана не как за- 
висимость отдельных значений у от величин х, а как зависи- 
мость частных средних ў; от значений х. 

Для выражения регрессии служат корреляционные уравне- 
ния, или уравнения регрессии, эмпирические и теоретически вы- 
численные ряды регрессии, их графики, называемые линиями 
регрессии, а также коэффициенты линейной и нелинейной рег- 
рессии. 

Показатели регрессии выражают корреляционную связь дву- 
сторонне, учитывая изменение усредненных значений ў; призна- 
ка Ү при изменении значений х; признака Х, и, наоборот, по- 
казывают изменение средних значений Ж, признака Х по изме- 
ненным значениям у; признака У. Исключение составляют вре- 
менные ряды, или ряды динамики, показывающие изменение 
признаков во времени. Регрессия таких рядов является одно- 
сторонней. 

азличных форм и видов корреляционных связей много. За- 
дача сводится к тому, чтобы в каждом конкретном случае выя- 
вить форму связи и выразить ее соответствующим корреляци- 
онным уравнением, что позволяет предвидеть возможные из- 
менения одного признака У на основании известных изменений 
другого Х, связанного с первым корреляционно. 


1Х,1. ЛИНЕЙНАЯ РЕГРЕССИЯ 


Уравнение регрессии. Результаты наблюдений, проведенных 
над тем или иным биологическнм объектом по корреляционно 
связанным признакам У и Х, можно изобразить точками на 
плоскости, построив систему прямоугольных координат. В ре- 
зультате получается некая диаграмма рассеяния, позволяющая 
судить о форме и тесноте связи между варьирующимн призна- 
ками. Довольно часто эта связь выглядит в виде прямой или 
может быть аппроксимирована прямой линией. 

Линейная зависимость между переменными У и Х описыва- 
ется уравнением общего вида й,==а + Вх! + сх + ахз + .., где 
а, Б, с, ӣ,... — параметры уравнения, определяющие соотноше- 
ния между аргументами хі, 42, хз,..,Хт и функций ўх. В прак- 
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тике учитывают не все возможные а лишь некоторые аргумен- 
ТЫ, В простейшем случае — всего один: 


у„=а-- вх. (176) 


В этом уравнении линейной регрессии 2 — свободный член, 
а параметр 6 определяет наклон линии регрессии по отноше- 
нию к осям прямоугольных координат. В аналитической гео- 
метрии этот параметр называют угловым коэффициентом, в 


биометрии — коэффициентом регрессии. Наглядное представ- 
ление об этом параметре ио 
у положении линий регрессии 


У по Хи Х по У в системе 
прямоугольных координат 
дает рис. 26. 

Линии регрессии, как по- 
казано на рис. 26, пересека- 
ются в точке О (х, у), соот- 
ветствующей средним ариф- 
метическим значениям кор- 
реляционно связанных друг 
с другом признаков У и Х. 
При построении графиков 
регрессии по оси ‘абсцисс от- 


Рнс. 26. Лнннн регресснн У по Хн Х по и и Е 
У в системе прямоугольных координат СИМОИ переменно ‚а по 
оси ординат — значения за- 


висимой переменной, или функции У. Линия АВ, проходящая че- 
рез точку О (5х, 7) соответствует полной (функциональной) за- 
висимости между переменными величинами У и Х, когда коэф- 
фициент корреляции г;у= 1. Чем сильнее связь между У и Х, тем 
ближе линии регрессии к АВ, и, наоборот, чем слабее связь меж- 
ду этими величинами, тем более удаленными оказываются ли- 
нии регрессии от АВ. При отсутствии связи между признаками 
линии регрессии оказываются под прямым углом (90°) по отно- 
щению друг к другу и гху==0. 

Поскольку показатели регрессии выражают корреляционную 
связь двусторонне, уравнение регрессии (176) следует записы- 
вать так: 


Х А 


У.а, и Хуа Ву. (177) 


По первой формуле определяют усредненные значеиия ў, при 
изменении признака Х на единицу меры, по второй — усреднен- 
ные значения ў, при изменении иа единицу меры признака У. 

Коэффициент регрессии. Қоэффициент регрессии показыва- 
ет, насколько в среднем величина одного признака у изменя- 
ется при изменении на единицу меры другого, корреляционно 
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связанного с У признака Х. Этот показатель определяют по 
формуле 
5у 5 
бы Ее или Ё,у== гу А (178) 
Здесь значения 5 домножают на размеры классовых интерва- 
лов А, если их находили по вариационным рядам или корреля- 
ционным таблицам. 

Пример 1. В гл. УШ было показано, что корреляция меж- 
ду годовым удоем У и массой тела Х коров горбатовской по- 
роды характеризуется величиной г, ==0,523. Установлено так- 
же, что между этими признаками имеет место линейная связь. 
Имея в виду значения средних квадратических отклонений 
(5: ==2,843 и 5;==3,272) и величины классовых интервалов (А; == 
== 1592 и А==14), определим коэффициент регрессии годового 
уровня по массе тела коров: 

Б, 50 033, ‚272.14 23,958 
2,843. 152 432,136 

Аналогичным способом находим коэффициент регрессии мас- 

сы тела коров по их годовому удою: 
6.) ==0,523 2:813-152__ 228,007 4 954. 
3,272. 14 45,808 

Увеличение годового удоя коров этой группы на 1 кг связа- 
но (при прочих равных условиях) с повышением их живой мас- 
сы тела в среднем на 0,055 кг, тогда как увеличение массы те- 
ла коров на 1 кг в тех же условиях сопряжено с повышением 
годового удоя в среднем на 4,934 кг. Если же судить о соотно- 
шении живой массы тела коров и их годового удоя по средним 
арифметическим для стада, которые равны по удою Х== 
=:2235,6 кг, а по массе тела коров 7=349,6 кг, то получаются 
следующие результаты: на 1 кг массы тела коров приходится 
в среднем 2235,6/349,6 =6,395 кг молока, а прибавка годового 
удоя на | кг связана с увеличением массы тела коров в сред- 
нем на 349,6/2235,6=0,156 кг. 

При сравнении этих величин с коэффициентами регрессии 
видно, что они оказываются более высокими, чем бух и Ёру. 
Причина заключается в том, что отношения средних Х и ӯ не 
учитывают корреляцию между признаками, поэтому и не могут 
служить точными показателями изменчивости одного признака 
при изменении на единицу меры другого. Этот пример показы- 
вает, какое значение имеет коэффициент линейной регрессии в 
области анализа статистических связей. 

Коэффициент регрессии можно вычислить минуя расчет 
средних квадратических отклонений $, и $х по формуле 


НИ Я (и: — 0)? #5 У, (х; — х)? 
Бх Г у 5 или бу==Гуу у 2:27. о (179) 
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=0,0554. 


Если же коэффициент корреляции неизвестен, коэффициент рег- 
рессии определяют следующим образом: 


Уи — у) (х, х) _ Яша -х) 
Е УЗИСТ За ие или и В т 5 (180) 


Связь между коэффициентами регрессии и корреляции. 
Сравнивая формулы (180) и (144), видим: в нх числителе од- 
на и та же величина Ў (/;—0) (х: —Х), что указывает на нали- 
чие связи между этими показателями. Эта связь выражается 
равенством г2.у==бухбху, или 


гу = 6,6, (181) 


Коэффициент корреляции равен средней геометрической из ко- 
эффициентов б,; и 0,,. Формула (181) позволяет, во-первых, 
по известным значениям коэффициентов регрессии бух и бху оп- 
ределять коэффициент корреляции гу, а во-вторых, проверять 
правильность расчета этого показателя корреляционной связи 
Гху между варьирующими признаками Х и У. 

Так, используя известные коэффициенты регрессии удоя ко- 
ров У по массе их тела Х и массы тела коров по их удою (рух== 
==0,0554 и 6,,==4,934), определяем коэффициент корреляции 


между этими признаками: г, = 4,934.0,0554 =) 0,273 ==0,523. 
Полученная величина совпадает с той, которая была вычисле- 
на по формуле (152). 

Как и коэффициент корреляции, коэффициент регрессии ха- 
рактеризует только линейную связь и сопровождается знаком 
плюс при положительной и знаком минус при отрицательной 
связи. 

Определение параметров линейной регрессии. Известно, что 
сумма квадратов отклонений вариант х; от их средней х есть 
величина наименьшая, т. е. Ў (х;-—#)?==тіп (см. гл. ПТ). Эта 
теорема составляет основу метода наименьших квадратов (см. 
ниже). В отношении лннейной регрессии [см. формулу (176)] 
требованию этой теоремы удовлетворяет некоторая система 
уравнений, называемых нормальными: 


ап У х= у; 
а Ух +6 Ух => ху. 


Совместное решение этих уравнений относительно параметров 
а и 6 приводит к следующим результатам: 


п Ух |_ е А ХУ МХ |_ 22 
р-у. а Я А |85 
-хх Улу 8—5 20 пуху Ху, откуда а= 

хх Ули 
—=А/Р и Ь=В/р. 
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Учитывая двусторонний характер связи между переменными У 
и Х, формулу для определения параметра а следует выразить 
так: 


а, В о ЯР ХУ или (189) 
ух пух — (ха ° пў у? — (3)? 


ауу — 6, и аи=х-фй. (183) 


Параметр 65, или коэффициент регрессии, определяют по сле- 
дующим формулам: 
р — Пу, р Поли Уху. (184) 
о пух * “пб › 
_ Уху-Ух зу. —_Уху-Яхмут . 
етот 5 ито (8 
В. Яху— пху _. Е Уху — пху , (186) 


Ую ат 9 уи пў 


Пример 2. В табл. 96 содержатся данные о корреляционной 
зависимости между массой тела гамадрилов-матерей Х и мас- 
сой тела их новорожденных детенышей У. Воспользуемся эти- 
ми данными и найдем эмпирическое уравнение регрессии У по 
Х. Здесь аргументом, или независимой переменной, служит мас- 
са тела матерей, а зависимой переменной — масса тела ново- 
рожденных детенышей. В табл. 96 приведены нужные значения: 
п=20; Ху=14,06; Ух=237,4; Уху= 167,919 и Ух2=2861,60. Оп- 
ределим параметры линейной регрессии У по Х: 


= 20. 167,919 — 237 ,4.14,06 _ 22,536 0,0935. 
20.2861 ,6 — (237,4)2 873,240 
– -_ Уу Ух 14,06 237,4 
аи = 15. 0,0235 12 
ух 0 — ук п Ух п 20 : 20 


==0,703 — 0,0235-11,87==0,703 — 0,279 =0,424. 


Отсюда эмпирическое уравнение регрессии массы тела детены- 
шей ў; по значениям массы тела их матерей х; оказывается 
следующим: й.==0,42--0,024 х. 

Это означает, во-первых, что с увеличением массы тела ма- 
терей-гамадрилов на | кг масса тела новорожденных детены- 
шей увеличивается в среднем на 0,024 кг. Во-вторых, подстав- 
ляя в это уравнение вместо х конкретные значения, т. е. массу 
тела гамадрилов-матерей, можно определить вероятную (сред- 
нюю) массу новорожденных детенышей. Так, если масса тела 


1 Формулы (183) применимы лишь для определения свободного члена а 
линейной регресснн. Прн налнчнн нелннейной регресснн этн формулы прнме- 
нять нельзя, 
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самки гамадрила равна 12 кг, то ожидаемая масса тела ново- 
рожденного детеныша будет следующей: й.=0,42-|-0,024.12= 
==0,71 кг. Для самки с массой тела в 14 кг ожидаемая масса 
тела новорожденного детеныша будет составлять й,==0,42-|- 
0,024: 14=0,76 кг и т. д. 

Построение эмпирических рядов регрессии. При наличии 
большого числа наблюдений регрессионный анализ начинается с 
построения эмпирических рялов регрессии. Эмпирический ряд рг- 
грессии образуется путем вычисления по значениям одного варь- 
ирующего признака Х средних значений ӯ, другого, связанного 
корреляционно с Х признака У. Иными словами, построение 
эмпирических рядов регрессии сводится к нахождению группо- 
вых средних й; и Хх, из соответствующих значений признаков 
У и Х. Рассмотрим технику построения рядов регрессии на со- 
ответствующем примере. 

Пример 8. На численно большой группе мужчин (п==727) 
изучали корреляцию между длиной тела и обхватом груди. 
Собранные данные (по А. А. Малиновскому, 1948) сгруппиро- 
ваны в виде корреляционной табл. 116. Эллипсоидный характер 
распределения частот {х, по ячейкам корреляционной решетки 
указывает на наличие положительной хотя и не очень тесной, 
связи между этими признаками. В нижней строке этой табли- 
цы помещен ряд регрессии роста мужчин Х по обхвату их гру- 
ди У, а в правом крайнем столбце той же таблицы содержится 
эмпирический ряд регрессии обхвата груди У по росту мужчин. 
Эти ряды есть не что иное, как групповые средние Ху и Й»х, вы- 
численные для каждого столбца и каждой строки корреляцион- 
ной таблицы. Так, величина /.==81,5, что находится внизу по- 
следнего столбца табл. 116, получена следующим образом: 

Я 1.77,5 + 1.85,5 

Г ВО, 

Стоящая над ней величина = 82,0 вычислена аналогичным 
способом: ыы ПЕ 2880386), 0. Так же рас- 
считаны и групповые средние роста мужчин по обхвату их гру- 
ди, помещенные в нижней строке табл. 116. Например, величи- 


на Х,==155,8 (первая в нижней строке таблицы) вычислена 


— 1. 
так: Ху= == 183 02108 155,8. Следующая величина Х,== 


= 158,0 получена таким же способом: х,= (1/8). (2.152,5-- 
1.154,5--1. 156,5--1.158,5--2. 162,5--1.164,5) =158,0 и т. д. 

Из табл. 116 видно, что эмпирический ряд регрессии — это 
двойной ряд чисел, которые можно изобразить точками на плос- 
кости, а затем, соединив эти точки отрезками прямой, полу- 
чить эмпирическую линию регрессии. Эмпирические ряды рег- 
рессии, особенно их графики, называемые линиями регрессии, 
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дают наглядное представление о форме и тесноте корреляцион- 
ной зависимости между варьирующими признаками. На рис. 27 
изображены эмпирические и выровненные по уравнению (177) 
линии регрессии окружности груди у по росту х и роста по ок- 
ружности груди мужчин. Видно, что они неплохо согласуются 
между собой. 


у 
93 


89 


85 


Окружность, см 


81 


77 


73 


150 154 158 162 166 170 10 ШХх 
Рост, см 


Рис. 27. Эмпирические и вычисленные по способу наименьших 
квадратов линии регрессии окружности груди мужчин У по 
росту Х и роста по окружности груди 


Пример 4. Выше было найдено (пример 1), что между го- 
довым удоем У и массой тела Х коров горбатовской породы 
существует положительная связь. Рассчитав усредненные зна- 
чения Йх; и Х, эмпирических рядов регрессии У по Х и Х по У, 
можно построить график аналогично тому, как это показано в 
примере 3. Значения ў; и х, содержатся в табл. 102. На осно- 
вании этих данных построена эмпирическая (ломаная) линия 
регрессии. Наглядное представление о ней дает рис. 28, на ко- 
тором наряду с эмпирической изображена и выровненная (плав- 
но идущая) линия регрессии. Последняя рассчитана по урав- 
нению Й,=4,934у--510,98. Читателю предлагается рассчитать 
это уравнение, используя предварительно найденные величины: 
Гхи == 0,523; 5.==3,27; 5,=92,843; А== 14; № = 152. 

Выравнивание эмпирических рядов регрессии. Графики эм- 
пирических рядов регрессии оказываются, как правило, не плав- 
но идущими, а ломаными линиями (см. рис, 27 и 28). Это объ- 
ясняется тем, что наряду с главными причинами, определяющи- 
ми общую закономерность в изменчивости коррелируемых приз- 
наков, на их величине сказывается влияние многочисленных 
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второстепенных причин, вызывающих случайные колебания уз- 
ловых точек регрессии. Чтобы выявить основную тенденцию 
(тренд) сопряженной вариацни коррелируемых признаков, 
нужно заменить ломаные линии на гладкие, плавно идущие ли- 
нии регрессии. Процесс замены ломаных линий на плавно иду- 
щие называют выравниванием эмпирических рядов и линий 
регрессии. 

Графический способ выравнивания. Это наибо- 
лее простой способ, не требующий вычислительной работы. Его 
сущность сводится к 
следующему. Эмпири- 3000 
ческий ряд регрессии 
изображают в виде гра- 
фика в системе прямо- < 150 
угольных координат. є 
Затем визуально наме- 
чаются срединные точ- 
ки регрессии, по кото- 
рым с помощью линей- 
ки или лекала прово- 
дят сплошную линию. 
Недостаток этого спо- 
соба очевиден: он не ис- 
ключает сир ИНДИ- 75] 370 тя 2 2 
видуальных свойств ис- 

Е на резуль- НИ а 
таты выравниваиия эм- Рис. 28. Эмпирическая и вычисленная линин 
пирических линий рег- регрессии годового удоя по массе тела коров 


рессии. Поэтому в тех корбатовской породы 

случаях, когда необхо- 

дима более высокая точность при замене ломаных линий регрес- 
сии на плавно идущие, используют другие способы выравнивания 
эмпирических рядов. 

Способ скользящей средней. Суть этого способа 
сводится к последовательиому вычислению средних арифмети- 
ческих из двух или трех соседних членов эмпирического ряда. 
Этот способ особенно удобен в тех случаях, когда эмпириче- 
ский ряд представлен большим числом членов, так что потеря 
двух из них — крайних, что неизбежно при этом способе вырав- 
нивания, заметно не отразится на его структуре. 

Пример 5. Изучали зависимость между содержанием жира 
и массой зерен у овса. Результаты приведены ниже: 

Классы по 

содержанию 

жира в зер- 

нах х, % .. 4,5 — 5,0 — 5,5 — 6,0 — 6,5 — 7,0 — 7,5 — 8,0 — 8,5 
Масса зерен, ух, 

МГ, 6... 45,0 45,8 44,3 419 40,1 39,0 37,5 37,5 


2000 


1500 


Годовой убой коров 
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Чтобы выровнять этот ряд, находим сумму первых двух 
членов: 45,0--45,8==90,8. Затем определяем сумму следующих 
двух членов: 45,8--44,3=90,1; 44,3--41,9==86,2 и так до конца 
ряда. Затем каждую полученную таким образом сумму делим 
на число слагаемых, в данном случае на два, и находим ус- 
редненные значения членов ряда: 45,4 45,0 43,1 41,0 39,6 38,2 
37,5. Получился выровненный ряд, более наглядно свидетель- 
ствующий о наличии отрицательной корреляции между этими 
признаками. 

Разумеется, в разных случаях способ скользящей средней 
применяют по-разному, вычисляя средние не из двух или трех, 
но и большего числа членов ряда. 


Метод наименьших квадратов. Этот способ пред- 
ложен в начале ХІХ столетия А. М. Лежандром и независимо 
от него К. Гауссом. Он позволяет наиболее точно выравнивать 
эмпирические ряды. Этот метод, как было показано выше, ос- 
нован на предположении, что сумма квадратов отклонений ва- 
риант х; от их средней Х есть величина минимальная, т. е. 
п 


ра (х, — х)? = тіп. Отсюда и название метода, который приме- 
1-1 

няют не только в биологии, но и в технике. Метод наименьших 
квадратов объективен и универсален, его применяют в самых 
различных случаях при отыскании эмпирических уравнений ря- 
дов регрессии и определении их параметров. 

Требование метода наименьших квадратов заключается в 
том, что теоретические точки линии регрессии ў; должны быть 
получены таким образом, чтобы сумма квадратов отклонений 
от этих точек для эмпирических наблюдений у; была минималь- 
ной, т. е. 


0 = У (и = 9) = У (И У О) = Они. 


Вычисляя в соответствии с принципами математического 
анализа минимум этого выражения и определенным образом 
преобразуя его, можно получить систему так называемых нор- 
мальных уравнений, в которых неизвестными величинами ока- 
зываются искомые параметры уравнения регрессии, а извест- 
ные коэффициенты определяются эмпирическими величинами 
признаков, обычно суммами их значений и их перекрестных 
произведений. В частности, такая система нормальных урав- 
нений, полученная для прямолинейного уравнения регрессии, 
приведена выше, в разд. 1Х.1. 

Сущность метода практически уже раскрыта на конкретных 
примерах, которые рассмотрены выше — при отыскании пара- 
метров а и $ линейной регрессии. При этом расчет параметров 
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производили непосредственно по значениям варьирующих приз- 
наков У и Х (малые выборки). 

Теперь следует выяснить, как применяется этот метод к вы- 
боркам, группируемым в вариационные ряды и корреляционные 
таблицы (большие выборки). Начнем с отыскания эмпириче- 
ских уравнений регрессии обхвата груди У по росту Х и роста 
по обхвату груди мужчин. Чтобы решить эту задачу, необходи- 
мо предварительно рассчитать средние арифметические й и #, 
средние квадратические отклонения 5; и 5х и вычислить коэф- 
фициент корреляции г», между этими признаками. Читателю 
предлагается (по примеру расчета г», между массой тела и го- 
довым удоем коров горбатовской породы) вычислить эти вели- 
чины, которые оказались равными 07==85,17; х= 164,62; $,== 
—2,02; 5х==2,73 И Гху==0,391. 

Переходим к определению параметров регрессии обхвата 
груди У по росту Х и роста по обхвату груди мужчин. Так как 
Ли==Ах==2, то эти величины можно не учитывать при определе- 
нии параметров Вух и 6, [см. формулу (178)]: 


5 2,02 
рр Ок 
Е и 2,73 


Вг, ги 0,391 т —0,598; 


=0,289 и 


Ы 


ауу Б, == 85,17 — 0,289. 164,62 =85,17 —47,58 =37,59 
и а= — ,,0 = 164,62 0,528-85,17 = 164,62 — 44,97 =119,65. 


Отсюда эмпирическое уравнение регрессии обхвата груди по 
росту йх==0,289х--37,59, а эмпирическое уравнение роста по 
обхвату груди х,==0,528у--119,65. 

Сумма членов ряда ў,’ регрессии, рассчитанных по корре- 
ляционному уравнению, должна быть равна сумме членов эм- 
пирического ряда, т. е. Хўх=Хй;'. Если окажется, что ХУЙ’ 56 
26у; или :ХЎ, 56 УХ, (как следствие приближенных вычисле- 
ний параметров), нужно эмпирические уравнения регрессии 
скорректировать так, чтобы указанные равенства осуществля- 
лись. В данном случае этому условию удовлетворяют уравне- 
ния ух=0,289х--37,5 и #,=0,528у4-119,1. Рассчитанные по 
этим уравнениям значения и, и Х, изображены в виде плавно 
идущих (сглаженных) линий регрессии У по Хи Х по У на 
рис. 28. Они неплохо согласуются с эмпирическими (ломаны- 
ми) линиями регрессии. 

Уравнение линейной регрессии можно выразить в виде от- 
клонений членов ряда от их средних: 


РА = (х Е х); ХЫ —х=6,, (у — 0). (187) 
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Система нормальных уравнений в этом случае будет выглядеть 


так: 
ап У (м =У(и-И; 
а У(и—я)-ь У (ия) -=У(и-И (и). 
Так как Х(у:—й)=0 и Х(х;—Х) =0, то параметр определяют 
по формуле (187), а параметр а легко найти по формуле (183). 


> Если средние ў и Хх перенести в правую часть уравнения 
(187), то получим 


у= 04-6,,(х— х); хх и (и, — 9). (188) 


Система нормальных уравнений для определения параметров 2 
и $ будет следующая: 


ап--ь р («—х)=У у; 
а > (х, х)--6 У (х-х)= У у(х). 
Так как Х(х—#) =0, то система уравнений оказывается такой: 
а= У у; 
У (х -х)= У у(х —х). 
Отсюда параметры уравнения линейной регрессии, выраженной 


в виде отклонений члеиов ряда от их средних величин, оказы- 
ваются следующими: 


ВИ ИЕ 
а= е =; (189) 
У (х1 х) 

Хбх)" а, 


Эти формулы особенно удобны при определении параметров 
эмпирических уравнений рядов динамики (см. ниже). 

Множественная линейная регрессия. Зависимость между не- 
сколькими переменными величинами принято выражать урав- 
нением множественной регрессии, которая может быть линей- 
ной и нелинейной. В простейшем виде множественная линей- 
ная регрессия выражается уравнением с двумя независимыми 
переменными величинами (х, 2): 


у=а-+|-0х--сғ, (191) 


где а — свободный член уравнения; ё и с-— параметры уравне- 
ния, Для нахождения параметров этого уравнения (по спосо- 
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бу наименьших квадратов) применяют следующую систему 
нормальных уравнений: 


оп У хс У2=Ху; 


а Ух+2 Уже Ух=У ху; 
а — 2+ У х+с Ууг=У уг. 


Чтобы по эмпирическим данным составить такую систему, не- 
обходимо предварительно рассчитать Хх, Ху, Хуг, Ххг, Ух? и 
522. 

Пример 6. Найти эмпирическое уравнение регрессии между 
числом колосков у, количеством зерен 2 и длиной колосьев Х 
у озимой ржи. Данные о корреляционной зависимости между 
этими признаками приведены в табл. 115. Объем выборки п== 
==10. Предполагая линейный характер связи между этими приз- 
наками и учитывая их буквенные обозначения, возьмем за ис- 
ходное уравнение регрессии уравнение вида 


х=а- фу са, 


которому отвечает выше приведенная система нормальных 
уравнений. Необходимые суммы см. в табл. 115. Подставляем 
их в уравнения системы: 


104 - 165 -- 294с = 575; 
1650 - 28916 4-5202с = 9908; 


2944 -|- 52025 -|- 9456с = 17816. 


Чтобы решить эту систему относительно параметров а, № и с, 
разделим каждое уравнение на коэффициент при 4, что дает: 


а--16,50006 --29,4000с =57,5000; (1) 
а-- 17,52126-|- 31,5273с = 60,0485; (П) 
а-- 17 69396 -- 32,1633с =60,5986. (Ш) 


Затем, вычитая первое уравнение из второго, а второе — из 
третьего, получим 


1,0212 4-2,12732-- 2,5485; 
0,1727 4-0,63600 =0,5501. 


Разделим каждое уравнение на коэффициент при Ё и найдем 
разность между полученными уравнениями: 


Ь + 2,0831с = 2,4956 
— р +3,6827с = 3,1853 
—1,5996с = —0,6897 
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—0,6897 
— 1,5996 ь 
нений вместо с его значение, находим 65--2,0831 (0,4312) = 
==2,4956, откуда 6 =2,4956-—0,8982= 1,5974. 

Наконец, в первое (исходное) уравнение вместо В и с под- 
ставляем их значения: 102+-165(1,5974) 4-294 (0,4312) = 575, От- 


остона Е ==18,466. В итоге 


х,==18,466-|- 1,597у-- 0,4312. 


Подставляя в это уравнение задаваемые значения переменных 
у и 2, можно определить ожидаемую величину переменной х, 
т. е. среднюю длину колосьев этой культуры. Так, для у= 10 
и 2=8 #,==18,4664-10(1,597)--8(0,431) = 37,3342 37,9 см; для 
у==15 и 2==14 средняя длина колоса х,==18,466--15 (1,597) -- 
+14 (0,431) = 48,455 25 48,5 см и т. д. 

Найденное эмпирическое уравнение регрессии показывает, 
что при изменении длины колосьев Х на 1 см число колосков 
У при постоянном количестве зерен / изменится в среднем на 
1,60, а число 2 при постоянной величине У изменится в среднем 
на 0,43. 

Ряды динамики, Выравнивание рядов. Изменение 
признаков во времени образует так называемые временные ря- 
ды или ряды динамики. Характерной особенностью таких ря- 
дов является то, что в качестве независимой переменной Х 
здесь всегда выступает фактор времени, а зависимой У — изме- 
няющийся признак. В отличие от рядов регрессии зависимость 
между переменными Х и У носит односторонний характер, так 
как фактор времени не зависит от изменчивости признаков. Не- 
смотря на указанные особенности, ряды динамики можно упо- 
добить рядам регрессии и обрабатывать их одними и теми же 
методами. 

Как и ряды регрессии, эмпирические ряды динамики несут 
на себе влияние не только основных, но и многочисленных вто- 
ростепенных (случайных) факторов, затушевывающих ту глав- 
ную тенденцию в изменчивости признаков, которая на языке 
статистики называется трендом. 

Анализ рядов динамики начинается с выявления формы 
тренда. Для этого временной ряд изображают в виде линейиого 
графика в системе прямоугольных координат. При этом по оси 
абсцисс откладывают временные точки (годы, месяцы и другие 
единицы времени), а по оси ординат — значения зависимой пе- 
ременной У. При наличии линейной зависимости между пере- 
менными Х и У (т. е. линейного тренда) для выравнивания ря- 
да динамики способом наименьших квадратов наиболее подхо- 
дящим является уравнение регрессии в виде отклонений чле- 
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Отсюда с== —0,4312. Подставляя в одно из этих урав- 


сюда а= 


зов ряда зависимой переменной У от средней арифметической 
+ ряда незавнсимой переменной Х [см. формулу (188)]. 

Пример 7. Наблюдения над физическим развитием макак- 
‚езусов в первый год их жизни показали, что масса тела малы- 
пей увеличивается с возрастом по закону линейной функции. 
3 этом легко убедиться, если результаты наблюдений над раз- 
зитием макак-резусов изобразить в виде линейного графика в 
‘истеме прямоугольных координат. 

Соответствующие данные приведены в табл. 117. 


Таблица 117 


Возраст х;, Масса Е 
мес тела у; (х;—8) и(х:—5) (е0)? Ух 
1 0,53 —5,5 —2,915 30,25 0,59 
2 0,71 —4,5 —3,195 20,25 0,70 
3 0,79 —3,5 —2,765 12,25 0,81 
4 0,98 —2,5 —2,450 6,25 0,92 
5 1,06 —1,5 — 1,590 2,25 1,03 
6 1,13 —0,5 —0,565 0,25 1,14 
7 1,25 +0,5 40,625 0,25 1,26 
8 71,43 + 1,5 +2,145 2,25 1,37 
9 1,51 +2,5 - 3,775 6,25 1,45 
10 1,59 + 3,5 -5,565 12,25 1,59 
11 1,65 44,5 47,425 20,25 1,70 
12 1,77 45,5 49,735 30,25 1,81 
7—78 14,40 = 15,790 143,00 14,40 


Определяем среднюю арифметическую ряда независимой пе- 
‚еменной: #==78/12=6,5. Эту величину можно получить и по 
толусумме крайних значений ряда: == (14-112) /2==6,5. Откло- 
ения от этой величины членов ряда зависимой переменной (с 
четом знаков) помещены в третьей графе табл. 117. Остальные 
‹ействия понятны из этой таблицы. 

Подставляя известные величины в формулы (189) и (190), 
эпределяем параметры линейной регрессии: а==14,40/12==1,20 
с == 15,790/143,00=0,1104. Отсюда эмпирическое уравнение 
лассы тела Ү по возрасту Х детенышей макак-резусов 


у,=1,20--0,1104(х,— х). 


Тодставляя вместо (х;—%) их значения, находим ожидаемые 
выравнивающие) значения зависимой переменной У: 


у,==1,20--0,1104 (—5,5) =1,20 — 0,61-0,59; 
у,=1,20-- 0,1104 (—4,5) =1,20 — 0,50=0,70 и т. д. 
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Рассчитанные таким образом значения ў; приведены в послел- 
нем столбце табл. 117. Видно, что они хорошо согласуются : 
эмпирически найденными значениями этого ряда. 


Таблица 11: 
Временные 
точки Процент : 
Әоцевок. | би) | иба) | ий" | 1, 

годы х; и | 

1962 1 22 —4 —88 16 20,9 

1963 2 28 —3 —84 9 22,8 

1964 3 16 —2 —32 4 24,7 

1965 4 28 —1 —28 1 26,6 

1966 5 34 0 0 0 28,4 

1967 6 22 +1 +22 1 30,3 

1968 7 30 +2 +60 4 32,2 

1969 8 41 +3 +123 9 34,1 

1970 9 35 +4 +140 16 36,0 
Сумма 45 256 — 113 60 256,0 


Пример 8. На протяжении 9-летнего периода обучения про- 
цент отличных оценок, получаемых студентами на экзаменаци 
онных сессиях по курсу дарвинизма, колебался следующим об- 

разом (табл. 118). 
В данном случае срел- 


3 
58 У нюю арифметическую для 
5 независимой переменной ог 
хе 40 Е ределяем по временным то= 
5837 % кам, обозначенным числамг 
=> 9 . = (1 

Е: РА натурального ряда: 2 = (1-| 
5 
Зал ХА -9)/2=5. Затем, как и ғ 
З х предыдущем примере, берел 
ЕЗ 
Ба отклонения членов ряда зг 
3$” висимой переменной У о" 
ооа ЭМИИ: Ж5ЛЕт ДЭБ СОБ. этой величины (тоже с уче 
х8 Ы Хх том знаков!) и производим 
ёе . операции, показанные Е 


табл. 118. Подставляя нак 


Рис. 29. Эмпирическая и вычислеиная . 
линии регрессии отличных оценок уча- Д@нные значения в формуле 


щихся за девятилетиий срок обучения (189) и (190), определяем 

параметры линейной регре‹- 

сии: а=256/9=28,44; Б =113/60= 1,883. Отсюда эмпирическо- 
уравнение ряда динамики отличных оценок знаний студентоЕе 
по курсу дарвинизма за десятилетний период оказывается следу- 


ющим: 0х=28,444-1,883(х;—7) 
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Рассчитанные по этому уравнению значения ў; зависимой 
переменной помещены в последнем столбце табл. 118. Они не- 
плохо согласуются с эмпирическими членами этого ряда. Бо- 
лее наглядное представление об этом дает рис. 29, на котором 
изображены эмпирическая (ломаная) и вычнсленная (плавно 
идущая) линии регрессии этого ряда. 


Числовые характеристики рядов динамики. 
К числу основных обобщающих числовых характеристик рядов 
динамики относят среднюю геометрическую 8; и близкую к ней 
среднюю арифметическую # величины, о которых речь шла в гл. 
П. Они характеризуют среднюю скорость, с какой изменяется 
величина зависимой переменной за определенные периоды вре- 
мени. Так, судя по данным табл. 117, средняя месячная при- 
бавка массы тела макак-резусов за первый год их жизни опре- 


деляется следующим образом [см. формулу (12)]: 
- 18 х. — 18 хо 18 117 — 18 53 ‚24797 — 1,72428 
16 еа тагтан 


= 0:52369 „0 047608. 


Отсюда #;==0,11 мг. Эта величина получается и при вычисле- 
нии средней арифметической Хх из месячных абсолютных при- 
бавок массы тела макак-резусов за первый год их жизни (чи- 
тателю предлагается рассчитать эту величину). 

Оценкой изменчивости членов ряда динамики служит сред- 
нее квадратическое отклонение. Примеры такой оценки будут 
рассмотрены ниже. При выборе уравнений регрессии для опи- 
сания рядов динамики учитывают форму тренда, которая мо- 
жет быть линейной (или приведена к линейной) и нелинейной. 
О правильности выбора уравнения регрессии обычно судят по 
сходству эмпирически наблюденных и вычисленных значений 
зависимой переменной. Более точным в решении этой задачи 
является метод дисперсионного анализа регрессии (см. ниже). 

Корреляция рядов динамики. Нередко приходится 
сопоставлять динамику параллельно идущих временных рядов, 
связанных друг с другом некоторыми общими условиями, на- 
пример выяснять связь между производством сельскохозяйст- 
венной продукции и ростом поголовья скота за определенный 
промежуток времени, определять влияние агротехники возделы- 
вания сельскохозяйственных культур на их урожайность и т. д. 
В таких случаях характеристикой связи между переменными Х 
и У служит коэффициент корреляции т,, (при наличии линей- 
ного тренда). 

Известно, что главное направление изменчивости, или тренд 
рядов динамики, как правило, затушевывается колебаниями 
членов ряда зависимой переменной У. Отсюда возникает зада- 
ча двоякого рода: измерение зависимости между сопоставляе- 
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мыми рядами, не исключая тренд, и измерение зависимості 
между соседними членами одного и того же ряда, исключая 
тренд. В первом случае показателем тесноты связи межд` 
сопоставляемыми рядами динамики служит коэффициен" 
корреляции (если связь линейна), во втором — коэффициен” 
автокорреляции. Эти показатели имеют разные значения, хотя к 
вычисляются по одним и тем же формулам [см. формулы (144, 
(145) и др.]. 


Таблица 11: 
Времен- | Площадь | сос аи Та 
Е зерна рина РРС | аеро |. (ааа) у 
годы та т 
1 154 25 —106 —25 2650 | 11236 625 
2 158 28 —102 —22 2244 | 10404 484 
3 216 43 —44 —7 308 1936 49 
4 280 64 +20. +14 280 400 196 
5 325 55 +65 +5 325 4225 25 
6 340 68 +89 +18 1440 6400 324 
7 354 79 +94 4-29 2726 8836 841 
8 350 82 +90 +32 2880 8100 1024 
Сумма — — 97 44 12853 | 51537 3568 


Пример 9. В табл. 119 приведены данные об увеличении з: 
8 лет черного пара в одном из колхозов РСФСР и сборе зерн: 
пшеницы с паровых полей. Вычислим коэффициент корреляци» 
между этими рядами исходя из того, что зависимость межд" 
ними следует закону линейной регрессии. Чтобы упростить ра‹- 
четы, каждый член ряда независимой перемениой Х уменьших 
на 260, а члены ряда зависимой переменной У— на 50. Такс 
го рода преобразование чисел не сказывается на значении к‹- 
эффициента корреляции, которое будет одним и тем же прг 
вычислении его по значениям х; и у; или же по преобразован- 
ным значениям х*=х;—260 и у*=0;-—50. 

Применим формулу (147) и предварительно рассчитаем 


ЕН и. 533,5; 2,= У = Бат 


п п 


—50361; р, уи В ава — 8 388 УБЛ, = 


И 50361-3326-=12942,2. Отсюда г„-=- ИЖ 


УБ,Бу 
—12 858 — 583,5 12319,50 959, Это довольно высокий поке 
12942,2 12942,2 


затель, свидетельствующий о весьма сильной положительно? 
272 


вязи между количеством собранного зерна пшеницы и увели- 
ением парового клина в общей структуре посевных площадей 
холхоза. 


Вычислим коэффициент автокорреляции как меру сопряжен- 
‹ости между членами одного и того же ряда динамики. Для 
того необходимо сдвинуть члены ряда на принятую единицу 
ремени, в данном случае равную одному году, что позволит 
эбразовать ряды двух переменных У и Х. При этом число пар- 
тых значений двойного ряда п уменьшается на единицу. Сдвиг 
зяда динамики на единицу времени оправдывается и тем, что 
злияние пара на урожай сказывается обычно через год. 


Таблица 120 


СЕЕ 


—106 —102 10812 11 236 10 404 
—102 —44 4488 10 404 1936 
—44 +20 —880 1 936 400 
+20 +65 1 300 400 4 225 
+65 +80 5 200 4 225 ` 6400 
+80 +94 7 520 6 400 8836 
+94 +90 8 460 8 836 8 100 

7 203 36 900 43 437 40 301 


Чеобходимые данные и расчет вспомогательных величин при- 
едены в табл. 120. В данном случае Ухху/п=7.203/7=203; 
2,=43 437—717 = 43 430; Р,=40 301—2032/7=34 414. Подстав- 


36 900 — 208 
яем эти величины в формулу (147): муа 
36 697 


=-— —_ =0,949. Это означает, что в ря инамики па- 
38660,1 РАЛУ А 


зового клина между членами независимой переменной Х су- 
цествует высокая положительная автокорреляция. 


Нетрудно заметить, что на значении коэффициента автокор- 
зеляции сказывается изменчивость членов ряда зависимой пе- 
земенной: чем меньше члены ряда отклоняются от тренда, тем 
‘ыше коэффициент автокорреляции, и наоборот. В этом легко 
'бедитьъся на примерах рядов динамики с разной изменчиво- 
тью членов ряда. Так, рассмотренный выше ряд динамики от- 
тичных оценок знаний студентов по курсу дарвинизма (см. 
“абл, 118) отличается сильной изменчивостью его членов и ха- 
зактеризуется коэффициентом автокорреляции, равным 0,171, 
`огда как слабоколеблющийся ряд возрастных изменений мас- 
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сы тела макак-резусов (см. табл. 117) характеризуется коэф- 
фициентом автокорреляции, равным 0,992 (читателю предлага- 
ется вычислить эти показатели). 


1Х.2. НЕЛИНЕЙНАЯ РЕГРЕССИЯ 


Регрессия, выражаемая уравнением параболы второго по- 
рядка. Как уже было показано, наряду с линейными корреля- 
циями в биологии встречаются и нелинейные корреляции между 
переменными величииами. Хорошо известна, например, нели- 
нейная зависимость между сроками лактации и удоем коров, 
логистическая закономерность возрастания численного состава 
популяции в замкнутой среде обитания и многие другие явле- 
ния подобного рода. Все оии отражают те или иные биологиче- 
ские закономерности и могут быть описаиы соответствующими 
корреляционными уравнениями, формулами или выражены в 
виде эмпирических или теоретически построенных линий рег- 
рессии и динамики. 

Нередко зависимость между переменными величинами У и 
Х выражается уравнением параболы второго порядка 


у=а-ох-- сх". (192) 


Отысканию параметров а, 6 и с этого уравнения удовлетворяет. 
следующая система нормальных уравнений: 


ап +6 У х-с Уг=У у; 
а У х-Ь У 2+ Уж=У ху; 
У У с У Уу. 


Чтобы решить эту систему относительно параметров а, 6 и с, 
нужно предварительно рассчитать Ух, Ху, Уху, Хх?, Хух?, Хх? 
и Ух. 

Пример 10. Наблюдения показали, что удой У группы ко- 
ров ярославской породы изменяется по срокам лактации Х 
следующим образом (табл. 121). 

Из табл. 121 видно, что значения зависимой перемеиной У 
сначала возрастают, а с седьмого месяца лактации иачинают 
убывать. Это признак параболической зависимости между пе- 
ременными У и Х. Найдем эмпирическое уравнение этой зави- 
симости. Предварительно рассчитаем вспомогательные величи- 
ны Ху, Уху, Хух? и др. Расчет приведен в табл. 121, 
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Составим систему нормальных уравнений: 
9а--456--285с ==203,3; 
454-2856 -- 2025с =1030,0; 
285 -- 20256 -|- 15 333с =6439,6. 


Зешая эту систему (описанным выше способом) относительно 
:‚оэффициентов а, 2 и с, находим: @==13,466; 6=4,587 и с= 
—— 0,436. Отсюда эмпирическое уравнение параболы второго 
торядка таково: 


у,=13,466 --4,587х — 0,4362. 
Таблица 121 


Лакта- 
ция хц, | УДой, 0, ху х? ух? хз хі 9, 
мес. ц | 
1 18,2 18,2 1 18,2 1 1 17,6 
2 20,1 40,2 4 80,4 8 16 20,9 
З 23,4 70,2 9 210,6 27 81 28,3 
4 24,6 98,4 16 393,6 64 256 24,8 
5 25,6 128,0 25 640,0 125 625 25,5 
6 25,9 155,4 36 932,4 216 1296 25,3 
7 23,6 165,2 49 1156,4 343 2401 24,2 
8 227 181,6 64 1452,8 512 4096 22,3 
9 19,2 172,8 81 1555,2 729 6561 19,4 
1=45 203,3 1030,0 285 | 6439,6 2025 15333 203,3 


Тодставляя в это уравнение вместо х значения независимой пе- 
‚еменной Х, можно рассчитать ожидаемые величины удоя ко- 
лов данной группы за любую лактацию: 


у,=03,466 -- 4,587 — 0,436 == 17,6; 
9. 13,466 4- 4,587 .2 — 0,436.22—20,9; 
0.==18,466--4,587.3 — 0,436.32—23,3 и т. д. 


?ти величины приведены в последнем столбце табл. 121. Они 
:орошо согласуются с фактическими данными. Более наглядно 
зто показано на рис. 30, где изображены эмпирическая и вы- 
тисленная (более плавно идущая) линии регрессии. Равенство 
Зу=УйЙ, указывает на то, что расчет значений ў, произведен 
травильно. 

Вычисление параметров параболы второго порядка значи- 
‘ельно упрощается, если воспользоваться следующими форму- 
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лами, найденными путем решения системы нормальных урав- 
нений: 


ЕЁ 4— 2 2). Ву. 
ахуе хуи) 2-29 


и с= (пух УУ), 


где Д=ихх“— (5х2)? — определитель системы; и — число чле- 
нов ряда регрессии; у; — значения зависимой перемен- 
ной Ү, а через х обозна- 
чены отклонения чле- 
нов ряда независимой 
переменной от средней 
величины, т. е. х= (х:— 
— х). Чтобы применить 
эти формулы, достаточ- 
но рассчитать следую- 
щие вспомогательные 
величины: Ху, Хух, ХЎх?, 
153 45 65 7 ё 9х Уух? и 5. 

Лактация Пример 11. Восполь- 


р А зуемся данными о свя- 
ис. 30. Эмпирическая и вычисленная по урав- зи между удоем Уи 


нению параболы второго порядка кривые лак- 
} Зря Ве сроками лактации Х у 


коров ярославской по- 
роды и рассчитаем с помощью указанных формул эмпирическое 
уравнение этой связи. Расчет вспомогательных величин приве- 
ден в табл. 122. Среднюю (х) вычисляют, как и в предыдущих 


случаях, по формуле х= Ух/п= 45/9=5. Подставляя известные 


0 о" 0 >. 2. .60 
величины в формулы, находим: а=-2 033-708 — 12221-0) __ 


9.708 — 60.60 
ОВОЗА ЗБ ДИТ. ь—13,5 0,295, 20 9. 1222,1 — 203,3.60 = 
2772,0 60 9.708 — 60.60 


__—1199,1 

2772,0 
сии удоя коров по срокам лактации, выраженное в отклонениях 
членов независимой переменной от их средней, 


у,=24,473.--0,225х — 0,4326х2. 


Подставляя в это уравнение вместо х конкретные значения 
независимой переменной Х, выраженные в виде отклонений их 
от средней арифметической х данного ряда, можно определить 
ожидаемые значения зависимой переменной У: 


у,==25,473--0,295(—4)— 0,4326 (16)=25,473 —7,822 —17,6; 
у,=25,473--0,225(—3) —0,4326 (9) =25,473—4,568—20,9 и т.д. 
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== —(),43266. Отсюда эмпирическое уравнение регрес- 


Зычисленные таким образом значения 7; зависимой переменной 
‹омещены в последнем столбце табл. 122. Как н в предыдущем 
‘лучае, они хорошо согласуются с членами эмпирического ряда. 


Таблица 122 


ция Х, ц х= ХХ ух х ух? х Ух 
мес 

1 18,2 — —72,8 16 291,2 256 17,6 

2 201 | -3 —60,3 9 180,9 81 20,9 
3 23,4 —2 —46,8 4 93,6 16 23,3 
4 24,6 —1 —24,6 1 24,6 1 24,8 
5 25,6 0 0 0 0 0 25,5 
6 25,9 +1 +25,9 1 25,9 _1 25,3 
7 23,6 +2 +47,2 4 94,4 16 24,2 
8 22,7 +3 +681 9 204,3 81 22,2 
9 19,2 +4 76,8 |. 16 307,2 256 19,4 
203,3 а 13,5 60 12221 708 203,3 


7=45 


Расчет параметров а, 6 и с еще более упрощается, если каж- 
1ый член зависимой переменной У уменьшить на некоторое 
троизвольно взятое число К, т. е. значения у; заменить иа у;* == 
=у:—К. При этом параметр а определяют с поправкой на ве- 


Таблица 123 


ТАБЕ Удой У х=х-—Х у*=У—К х? у*х у х" хі 
1 18,2 —4 —1,8 16 7,2 —28,8 256 
2 20,1 —3 0,1 9 —0,3 0,9 81 
3 23,4 —2 3,4 4 —6,8 13,6 16 
4 24,6 —1 4,6 1 —4,6 4,6 1 
5 25,6 0 5,6 0 0 0 0 
6 25,9 +1 5,9 І +5,9 5,9 1 
7 93,6 Но 3,6 Чт р 14,4 16 
8 227 +3 2,7 9 8,1 24,3 81 
9 19,2 +4 —0,8 16 —3, —12,8 256 

Сумма — — 23,3 60 13,5 22,1 708 


ичину К, которую прибавляют к а*, т. е. а=а*--К. При вы- 
‘ислеиии параметров 2 и с поправки ие иужиы. Этот прием зиа- 
‘ительно облегчает вычнсление вспомогательных величин, осо- 
зенно в тех случаях, когда зависимая перемеиная представлена 
ядом миогозначиых чисел. 
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Пример 12. Как и в предыдущих случаях, воспользуемся 
фактическими данными о корреляционной зависимости между 
удоем У и сроками лактации Х у коров ярославской породы и 
найдем эмпирическое уравнение регрессии У по Х. Предвари- 
тельно каждый член ряда зависимой переменной У уменьшим 
на величину К==20, т. е. вместо значений у; примем у;*= 
=:/:—20. Исходя из преобразованных таким образом членов 
ряда зависимой переменной, рассчитаем вспомогательные ве- 
личины (табл. 123). 

Подставляя известные суммы в формулы, находим: а=а’-РК= 


2.288.108 22.1. 60 0.0. 160. 100 —54797420-064707: 


9.708 — 60-63 2772,0 

13,5 9.22,1 —23,3.69 —1199,1 
0,226; ом т — 0,4396. - 

60 | 9.708 — 60.60 2772 Полу 
чились те же результаты, что и выше. _ Е 

2 
Если к параметру а прибавить мВ ‚ параметр ё ум- 
р ру р 1. р рду 
2х И 


[1 
ножить на (5 ) ‚ а параметр с разделить на квадрат ин- 


42 
тервала ^? между членами ряда независимой переменной, т. е. 
вместо с взять с/А?, то получатся следующие коэффициенты 
уравнения параболы второго порядка (учитывая, что в данном 
случае А=1): а’ = 25,4727 (—0,4326.25) — (0,225.5) = 
=25,4727—11,940 =13,533; 65’=0,225—2 (—0,4326.5) = 0,225— 
—2 (2,163) =4,551; с’=—0,43257. Отсюда эмпирическое уравне- 
ние регрессии удоя коров по срокам лактации, в котором пере- 
менная х обозначает не отклонения членов ряда Х от их сред- 
ней х, а непосредственные значения членов этого ряда, будет 
таковым: 


0. 18,53--4,55х — 0,4326л2. 


Подставляя в это уравнение значения независимой перемен- 
ной Х, находим выравнивающие значения зависимой перемен- 
ной У: 


ук, =13,53-1 4,55.(1) —0,4326-(12) = 18,08 — 0,4326 == 17,6; 
ух, =13,53--4,55-(2) — 0,4396-(22) 292,63 — 1,73—20,9 и т. д. 


Остальные действия объяснены выше. 

Регрессия, выражаемая уравнением параболы третьего по- 
рядка, Среди различных форм параболической зависимости 
между переменными величинами встречаются и такие, которые 
наилучшим образом описываются уравнением параболы треть- 
его порядка: 


у=а-|-0х-|-сх |а х3. (193) 
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Для определения параметров этого уравнения используют сле- 
дующую систему нормальных уравнений: 


пахса УУ; 
ах Уахи; 
а Ў х24-6У хс Уха Ў х= Уух?; 
а Ух 0 7х сУ ха У х У ух. 


Решение этой системы относительно параметров а, 6, си  при- 
водит к следующим формулам: 


= бух Ху 
= 0505-Х) 
с=-- пху Ху) 
1 


4—5 22 Ул Уху х), 


где ЮРу==пӰх*— (3252)? и Рр,= Ххх (54)? — определители 
системы; п — число членов ряда регрессии; х; и у; — значения 
переменных, из которых независимая переменная выражается 
отклонениями членов ряда от их средней величины 

Для нахождения параметров а, Ё, си 4 нужно предвари- 
тельно рассчитать Ху, Хух, Ўх?, Ух?у, Ўх?у, Ўх* и Ях. 

Пример 13. В отношении некоторого объекта было прове- 
дено девять испытаний, которые дали следующие результаты: 


7.4 5 6 7 8 9 10 И 12 13 
у 78,0 76,1 73,6 72,9 70,8 69,4 69,3 69,0 69,1 


В данном случае с увеличением независимой переменной Х 
зависимая переменная У закономерно убывает, т. е. ведет се- 
бя не так, как это имело место в отношении кривой лактации. 
Для нахождения выравнивающих значений этого ряда урав- 
нение параболы второго порядка не подходит, в чем легко убе- 
диться, проделав необходимую вычислительную работу. Приме- 
ним к отысканию эмпирического уравнения регрессии этого ря- 
да параболу третьего порядка. Предварительно, чтобы облег- 
чить вычислительную работу, уменьшим каждый член ряда за- 
висимой переменной у на К==68, т. е. заменим значения у на 
у*—=у—68. 

Средняя арифметическая для членов ряда независимой пе- 
ременной х=9. Отклонения от этой величины и расчет необхо- 
димых вспомогательных сумм приведены в табл. 124. 
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Находим значения определителей: О! =9.708—60? ==2772 р 
Р.=60.9780—7082=85 536—501 264=85 536. Переходим к вы 
числению параметров; при этом параметр а надо увеличить нг 
К==68. При вычислении параметров Б, си 4 поправки не нуж- 
ны: 


36,2.708 — 60.293 ,4 8025 ‚6 
У Е бо 5 

Е 2772 т 2779 6 

==2,8954-68=70.895: ф=—— 699180 =-108(--799,2),_ 1089864 
85 536 85 536 
9.293,4 —36,2.60 486,6 
тд 0.160: 
7 2772 2772 а 
60 (—799,2) — (—69.70 5 
а= В 099108) 90000005, 
85 536 85 536 

Таблица 12- 
х у у" х= хе | х2 | му» хз хзу* х* х8 у, 
5 | 78,0| 10,0 | —4 |—40,0[16 |160,0 | —64 |—640,0| 256 |4096 | 78,0 
6 | 761] 81| —3 |—243| 9 | 72,9| —927 |2187] 81 | 729 | 760 
7 | 73,6|] 5,6 | —2 (11,21 4| 224|—8 | —448| 16| 64| 740 
8| 729| 49| -1|-49 |1 891 =[. | —449 1 1 | 72,2 
9 | 70,8| 2,8 0110-1120. |110 0 0 0 0 | 70,9 
10 | 694[ 14 | +1 |414 р | аа + А 1 1 | 69,8 
| 69,3] 13| +2 |426 141! 52| +8 10,4| 16| 64 | 691 
12 | 69,0| 1,0 | +3 143019 | 90| +27| +270! 81 | 729 | 689 
13 16911 11 | +4 [44 (16 | 17,6| +64| +70,4| 256 | 4096 | 69,2 
У | 648,2 | 36,2 | — |-69,0| 60 | 293,41 — |--799,2| 708 |9780 | 648,2 


Отсюда эмпирическое уравнение регрессии У по Х: 
у,==70,895 — 1,274х-|- 0,169? -- 0,0105.3. 


Подставляя в это уравнение вместо х отклонения членов ряд: 
независимой переменной Х от их средней арифметической 5 
находим ожидаемые (выравнивающие) значения зависимой пє 
ременной й:,: Ух == 70,895 — 1,274(— 4) +- 0,169(16) - 
- 0,0105 ( — 64) = 70,895 -|- 5,096 + 2,704 — 0,672 = 78,0; 7,, = 
==70,895— 1,274 (—3)--0,169 (9) ---0,0105 (—27) =70,895-3,822 - 
--1,521—0,2835==76,0 и т. д. 

Рассчитанные таким образом выравнивающие значения ў- 
приведены в последнем столбце табл. 124. Видно, что они нє 
плохо согласуются с эмпирически найденными членами ряде 
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:ависимой переменной У, о чем более иаглядно свидетельству- 
т рис. 31. 

Как и в предыдущем случае, параметры а, ё, си 4 парабо- 
іы третьего порядка можно корректировать, применяя для это- 
о следующие формулы: 

5% | сх? , ахз 6 2х | Зах 
а°=а--—— аа еру 
ГЕ Те: А а) 
И. За. ва 
А2 Аз а 


Лрименительно к рассматриваемому примеру (учитывая, что 
„== 1) это выглядит так: 2°=70,8954- (— 1,274) (9) --0,169 (92) — 


а 


0 5 7 9 11 ВХ 
Значения независимой переменной 


"ис. 31. Эмпирическая и вычисленная по уравнению па- 
раболы третьего порядка линни регрессии У по Х 


—9,0105 (93) =88,396; 65°=--1,274—2.0,169 (9)-3-0,0105 (9?) = 
=— 1,764; с°==0,169—3.0,0105(9) =— 0,1145; 4°== 0,0105. Отсю- 
а эмпирическое уравнение регрессии У по Х: 


у,=88,396 — 1,764х — 0,1145х2--0,0105х2. 


Подставляя в это уравнение вместо х значения независимой те- 
земенной Х, находим: 0х, == 88,396 — 1,764(5) — 0,1145(52) -- 
т- 0,0105 (53) =88,396—8,820—2,8625-|-1,3125==89,708—11,682 == 
== 78,03; 0;,==88,396— 1,764 (6)—0,1145 (6?) --0,0105 (63) = 75,96 
276,0 ит. д. 

Регрессия, выражаемая уравнением гиперболы первого пс- 
'ядка. В зависимости от наклона кривой регрессии к осям пря- 
лоугольных координат корреляционная зависимость между пе- 
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ременными величинами может быть выражена тем или иным. 
уравнением гиперболы. В простейшем виде гиперболическая за 
висимость между переменными У и Х описывается уравнениел 
гиперболы первого порядка: 


9. =а4- 2. (194 


Для определения параметров а и 6 этого уравнения служит 
следующая система нормальных уравнений; 


уун 


Их, 1 у 
а У — 46 У — = у —. 
ЭЗ х Вр х9 х 
Таблица 127 
РІ 1 1 ЕА 
х, кг у х? ка Е Ру Ук 
1,4 673 1,96 480,7 0,714 | 0,5102 669 
2,2 489 4,84 222,3 0,454 0,2066 | 487 
2,3 451 5,29 196,1 0,435 | 0,1890 | 473 
2,6 405 6,76 155,8 0,385 0,1479 | 438 
3,6 485 12,96 134,7 0,278 0,0772 | 364 
4,1 330 16,81 80,5 0,244 0,0595 340 
4,4 288 19,36 65,5 0,227 0,0517 329 
5,8 268 33,64 46,2 0,172 0,0297 | 290 
Сумма 3389 — 1381,8 2,909 1,2718 


Совместное решение этой системы относительно параметров ‹ 
и р приводит к следующим формулам: 


1 1 
т Еее 
1 1 
5-5: 5 -). 
где О=п 5; (5 е определитель системы; х — зне 


чения независимой; у— значения зависимой переменных велі 
чин; и — число членов ряда регрессии. Для нахождения пара- 
метров а и ё по этим формулам необходимо предварительн‹ 
рассчитать Ху, Ху/х, Х1/х и Х 1/52. 

Пример 14. Зависимость основного обмена у, выраженног‹ 
в килоджоулях на 1 кг массы тела обезьян за 24 ч, характере 
зуется следующими величинами (табл. 125). 
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Если эти данные изобразить графически в системе прямо- 
угольных координат, можио убедиться в том, что они выглядят 
в виде гиперболической зависимости между переменными Уи 
Х. Необходимые суммы для вычисления параметров а и 6 по 
уравнению (194) содержатся в табл. 125. Подставляя эти дан- 
ные в формулы, находим: 

пы 33,89.1,272 — 1381,8.2,91 —169,7 == 170; 
8.1,272 — (2,91)2 


р.__._8:1381,8 — 3389:2,91 __698,1 —698. 
8.1,272 — (2,912 


Отсюда уравнение регрессии Ү по Х: й.==170--698/х. 

Рассчитанные по этому уравне- 
нию ожидаемые величины основ- 
ного обмена у, приведены в пос- 
леднем столбце табл. 125. Видно, что 
вычисленные величины неплохо со- 
гласуются с данными опыта. Более 
наглядное представление об этом 
дает рис. 32, на котором изображе- 
ны эмпирическая (ломаная) и вычис- 
ленная (плавно идущая) линия рег- 
рессии У по Х. 

Регрессия, выражаемая уравне- 2 4 б 
нием гиперболы второго порядка. Масса тела , ке 
Для и о зираввиваоцих Рис. 32. Зависимость величины 
значений зависимой переменной ино- сосиовного обмена обезьян от 


— 
— 
<> . 


әу © 
а = 


< 
5 


Огнобной одмен, кДж [кг 
З ЗЕ 


> 
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гда более подходящим оказывается массы их тела 
уравнение гиперболы второго по- 
рядка 

0 =0--0— 

Ух == а * (195) 


Для определения параметров а и Б этого уравнения служит 
следующая система нормальных уравнений: 


+5 У-У 
1 1 
Е 


Решение этой системы относительно параметров аи 6 приводит 
к следующим формулам: 


о нЕ: 
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1 1 \2 

У | 
Для определения параметров а и 6 необходимо предваритель 

у 

но рассчитать Уу, 2 , я и: 
Пример 15. В семи хозяйствах района сопоставили урожае 
озимой пшеницы с себестоимостью 1 ц зериа этой культурь. 
Полученные результаты и их обработка приведены в табл. 126 


Таблица 12: 


у 1 1 2 

Х х=Х8 у | Е | а | КА ГР 
8 10 12,0 12,0 1,0000 1,0000 117 
11 14 8,0 4,08 0,5102 0,2603 84 
13 1,6 73 2,85 0,3906 0,1526 7,6 

19 24 6.0 1,04 0.1736 0,0301 6.1 
21 2.6 6.3 0,93 0,1479 0,0219 59 
27 3,4 5,8 0,50 0,0865 0,0075 55 
29 3,6 52 0,40 0,0772 0,0060 54 
Сумма 2н 50,6 21,80 2,3860 1,4784 50,6 


В этой таблице через Х обозиачен урожай пшеницы (ц/га) 
в разных хозяйствах района, а через у — себестоимость | г 
пшеницы (руб.). Чтобы облегчить вычисление вспомогательны: 
величин, значения независимой переменной Х сокращены не 
К==8, получениые результаты помещены во второй графе (х 
табл. 126. Используя суммы из табл. 126, находим значения 
определителей системы: Д == 7.1,4784 — (2,386)? == 10,3488 — 
—5,6930= 4,6558; А==50,6. 1,4784—21,80-2,3860==22,7922; В= 
—7.21,80—50,6.2,3860 ==31,8684. Отсюда а==А/О==22,77/4,65= 
==4,895; 6=В/0 =31,868/4,656=6,8445. Эмпирическое уравнє 
ние гиперболы второго порядка оказывается следующим: 


= 6,8 
а еа . 


Рассчитанные по этому уравнению ожидаемые зиачения зависе 
мой переменной у. приведены в последнем столбце табл. 126 
Видно, что они неплохо согласуются с эмпирическими значе- 
ниями признака у. Более наглядно это показано на рис. 33, где 
изображены эмпирическая и выровненная по уравнению гнпег- 
болы второго порядка линии регрессии. 
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Регрессия, выражаемая уравнением гиперболы третьего по- 
‚ядка. В практике встречаются случаи, когда с увеличением не- 
:ависимой переменной Х зависимая переменная У, быстро убы- 
зая, вскоре стабилизируется на определенном уровне, прини- 
тая более или менее постоянные значения. В таких ситуациях 
ля выравнивания эмпирического ряда регрессии можно ис- 
пользовать уравнение гиперболы третьего порядка: 


и. (196) 


хз 


1 3 5 7 вх 
Чрожай пшеницы, 102 ке га 


?ис. 33. Зависимость между себестоимостью пшеницы и 
урожаем этой культуры 


для определения параметров а и 6 этого уравнения применяют 
‘ледующую систему нормальных уравнений: 


+5 У = Уи 
ей 


Решая совместно эти уравнения относительно параметров а 
1 $, получаем следующие формулы: 


(55-525): 
О] 


2 
еру о> и ) . Отсюда следует, что для нахождения 
хб х3 

параметров а и 6 необходимо предварительно рассчитать Ху, 
у, р ыы 

х3 хз хб 

Пример 16. В табл. 127 приведены результаты восьми одно- 
типных испытаний и их обработка по формуле (196). 


Таблица 127 


РА 1 1 Е 
х у а Е 75 25. Ру Их 
1 29,0 1 1 29,000 1,0000 1,00000 98,4 
2 5,9 8 64 0,738 0,1250 0,01562 5,7 
3 3,4 27 729 0,126 0,0370 0,00137 3,4 
4 3,8 64 4096 0,059 0,0156 0,00024 2,9 
5 2,5 125 15625 0,020 0,0080 0,00006 27 
6 2,0 216 | 46656 0,009 0.0046 0,00002 2,6 
7 2,3 343 | 117649 0,007 9,0029 0,00001 2,6 
8 1,9 512 | 262144 0,004 0,0020 0,00000 2,5 
Сумма 50,8 — — 29,963 1,1951 1.01732 50,8 


Из данных табл, 127 видно, что после резкого снижения чис- 
ловых значений зависимой переменной у они постепенно стаби- 
лизируются, оставаясь примерно на одном уровне. Найдем эмпи- 
рическое уравнение этой регрессии: р=8. 1,01732—1,19512 = 
= 8,1386— 1,4283 = 6,710; А = (50,8. 1,01732—29,963. 1,1951) /6,710= 
=: 15,871/6,710 == 2,37; В = (8.29,963 — 50,8 . 1,1951) /6,710 = 
= 178,993/6,710= 26,676. Эмпирическое уравнение регрессии У 
по Х оказывается следующим: 


0,.==2,37-- 


Испытание этого уравнения показало, что оно не удовлетворяет 
равенству Ху= Хӯ;; корректируя его, находим точное уравнение 
регрессии Ү по Х: 


26,676 
хз ‘ 


Рассчитанные по этому уравнению выравнивающие значения 
Ух приведены в последнем столбце табл. 127. Видно, что они 
неплохо согласуются с эмпирическими значениями переменной 
Ү. Более наглядное представление об этом дает рис. 34. 
Регрессия, выражаемая уравиеиием гиперболы первого по- 
рядка с тремя неизвестными: а, 6 и с. Если с увеличением неза- 
висимой переменной Х зависимая переменная Ү быстро убывает, 
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остигая некоторого предела, за которым обнаруживается более 
ли менее стабильное течение функции, то для выравнивания эм- 
лирических значений зависимой переменной может быть исполь- 
зовано уравнение гиперболы следующего вида: 


у=а-вх---—. (197) 


Для определения параметров а, Ё и с этого уравнения служит 
‘ледующая система нормальных уравнений: 


Аад 
а Ух Уап У ху; 
тех 
а У = ++ У Е: У _. 
їтобы по выборочным данным составить такую систему, необхо- 
у 1 
имо предварительно рассчитать Ух, Ху, Уху, х , Э == и 


рае 
, 
е. 
1=2+ 2; 
5 4= 3 
№. 
2 
0 
НЕ 


П К] 5 7 Х 
Значения незайисомой переменной 


Эне, 34. Эмпирическая и вычислениая по уравнению: а тре- 
тьего порядка линин регрессии Ү но Х 


Тример 17. Как показали многочисленные наблюдения, с уве- 
іичением числа нгзависимых испытаний (п) величина ошибки 
:реднего результата $; закономерно уменьшается: 


Число испытаний..., 5 10 15 20 25 30 35 4 45 
Ошибка средией ‚... 6,2 2,9 156 19 Ш 0,9 },2 0,9 09 
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Эта связь между переменными лй и 5; имеет гиперболические 
характер и может быть описана с помощью уравнения (197, 
Найдем эмпирическое уравнение этой связи. Чтобы облегчит» 
вычислительную работу, обозначим перемеииые п и 5; соответст- 
венно через Х и У и сократим значения независимой переменної 
Х на 5. Тогда аргумент Х выразится рядом натуральных чисел 
1, 2, 3, ... Расчет вспомогательных величин приведен в табл 
128. 


Таблица 12: 


Преобра- 
зованные | Велнчнна Ем Я 1. 2 - 
ЧЕСИ" 
та х 
1 6,2 6,2 6,200 1 1,000 1,0000 6,2 
2 2,9 5,8 1,450 4 0,500 0,2500 2,9 
3 1,6 4,8 0,533 9 0,333 0,1111 1,9 
4 1,9 7,6 0,475 16 0,250 0,0625 1,4 
5 1,1 5,5 0,220 25 0,200 0,0400 1,2 
6 0,9 5,4 0,150 36 0,167 0,0278 111 
7 1,2 8,4 0,171 49 0,143 0,0204 1,0 
8 0,9 7,2 0,113 64 0,125 0,0156 1,0 
9 0,9 8,1 0,100 81 0,111 0,0123 0,9 
45 17,6 59,0 0,412 285 2,829 1,5397 17,6 
Ў =45 


Составляем систему нормальных уравнений: 
9а -|-456--2,83с == 17,6; 
45а -- 2856 + 9с =59,0; 
2,83а 4-96 -- 1,54с =9,412. 


Решая эту систему относительно параметров а, Б ис (как описа 
но выше), находим: а=— 0,571; 6 = 0,0871; с= 6,6496. Отсюда эм 
пирическое уравнение регрессии У по Х: 


„= —0,571-4+0,0871х-} 06. 


Подставляя в это уравнение вместо х преобразованные значения 
аргумента, находим: 


у,== — 0,571-+0,0871:1--6,6496/1=—6,2; 
у= — 0,5714- 0,0871.2-- 6,6496/2 =2,9 и т. д. 


Рассчитанные таким образом значения ӯ, зависимой перемен- 
ной у приведены в последнем столбце табл, 128. Они хорошо с‹-- 
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ласуются с эмпирическими значениями функции, что более на- 
`лядно иллюстрирует рис. 35. Заметим, что в других подобных 
‘лучаях для выравнивания рядов регрессии более подходящими 
яогут быть уравнения гиперболы второго и третьего порядков с 
`ремя неизвестными, т. е. 


ух==а--Ьх--с1х  у,=а-Рьх--с/хз и т. д. 


Регрессия, выражаемая уравнением показательного типа. 
3 тех случаях, когда основная тенденция эмпирического ряда ре- 
`‘рессии следует или оказывается близкой закону геометрической 


Число надлюдгний 


Рис. 35. Зависимость между числом наблюдений п и величиной 
ошибки $; средиего результата 7 


грогрессии, его удается описать уравнением экспоненциального, 
Іли показательного, типа: 


у==а6б* или у==ае*®, (198) 


1спользование уравнений такого вида связано с их логарифми- 
юванием, что позволяет трансформировать их в уравнение пря- 
10й линии. Так, в данном случае 


12 у=1еа--х1е6. (199) 


Логарифмическое преобразование исходного уравнения ре- 
`рессии не только облегчает вычисление параметров а и Ё, но и 
‘лужит своего рода контролем того, насколько правильно выбра- 
10 применяемое уравнение. В частности, условием правильного 
зыбора уравнения показательного типа служит требование, что- 
зы точки х и [2 у в системе прямоугольных координат находились 
та одной прямой, 
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Для определения параметров уравнения (199) служит сле 
дующая система нормальных уравнений: 


піва--166 Ух 180: 
еа Ух+186 Ух= (180. 


Совместное решение этой системы приводит к следующим фог 


мулам: 
8а=2- [Ув у-и Ух] ; 
15 = |У (х1) -УхУ ви : 


где Д=ихх?— (хх); п— число членов ряда; у — значения чле 
нов ряда зависимой переменной У; х — зиачения членов рядё 
независимой переменной Х, которые обычно выражают, как и Е 
предыдущем случае, числами иатурального ряда. 


Таблица 12‹ 


Возраст 
жнвотных 
м = 
И ге 0 х? 160 хів ГА 
факти, | чнсламн кг 
ческнй натураль- 
Х ного 
ряда х 
20 1 4,6 1 0,66276 0,66276 4,3 
26 2 4,5 4 0,65321 1,30642 5,0 
32 3 6,4 9 0,80618 2,41854 5,7 
38 4 6,1 16 0,78533 3,14132 6,6 
42 5 7,5 25 0,87506 4,37530 7,6 
48 6 8,0 36 0,90399 5,42394 8,7 
52 7 11 49 1.04139 7,28973 10,2 
Сумма 28 48,1 140 5,72792 2461801 48,1 


Из системы уравнений и приведенных формул следует, чт‹ 
для отыскания параметров а и $ нужно предварительно найте 
Ух, Ух?, хвуи (16). 

Пример 18. Наблюдения за развитием самцов павианов-га 
мадрилов в период полового созревания показали, что масса и? 
тела изменяется с возрастом следующим образом: 


Возраст Х, мес ,....... 20 96 32 38 42 48 52 
Масса тела У, кг,....... 4,6 45 64 61 7,5 8,0 110 
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Графический аиализ этих даиных показывает, что оии изме- 
‹яются по закону экспоненциальиой функции. Об этом свидетель- 
твует тот факт, что значения иезависимой перемениой Х и лога- 
зифмированные значения зависимой переменной У располагают- 
:я в системе прямоугольных координат на одной прямой. Найдем 
‘мпирическое уравнение, описывающее эту закономерность. 
]редварительно рассчитаем вспомогательные величины 
табл. 129). 


ГА 


17 21 25 29 33 37 Х 
Возраст, месяцы 


’ис. 36. Эмпирическая и вычислеииая по уравнению показательной 
зункции линии регрессии возрастных изменеиий массы тела самцов 
гамадрилов в период полового созревания 


Тодставляя известные величииы в формулы, находим 


162 5,72792.140 — 24,61801.28 ЕЭ 112,60452 —0,57451; 
7. 140 — 28.28 196 

196 = 7.24,61801 —28.5,72792 2 11, 94431 —0,060940. 
7.140 —28.28 196 


›тсюда эмпирическое уравнение регрессии У по Х: 
19 у,=0,061х--0,575. 


Подставляя в это уравнение вместо х значения независимой 
‘еременной, выраженные числами натурального ряда, находим 
9 7х, а затем по таблице логарифмов определяем значения у». 
?ассчитаиные таким образом значения И» приведены в послед- 
тем столбце табл. 129. Они неплохо согласуются с помещенными 
; той же таблице эмпирическими членами ряда. Более наглядное 
тредставление об этом дает рис. 36, на котором изображены эм- 


0* 291 


пирическая и выровненная по уравнению регрессия лннин массы 
тела У по возрасту Х самцов павианов-гамадрилов. 

Регрессия, выражаемая уравнением степеннбго типа. Зависи- 
мость между переменными величинами У и Х иногда хорошо опи- 
сывается уравнением степеннодго типа 


у. =ах?, (200) 


которое в результате логарифмирования превращается в урав- 
нение прямой линии: 


109,==16а --616 х. (201) 


Условием правильного применения этого уравнения служит тре- 
бование, чтобы точки 167 и 16 х в системе прямоугольных коор- 
динат находились на одной прямой, Эта особенность отличает 
уравнение степенной функцин от уравнения регрессни показа- 
тельного типа, когда в системе координат на одной прямой ока- 
зываются точки 16у и х. 

Для определения параметров а и 6 уравнения степенного ти- 
па служит следующая система нормальных уравнений 


п16а--5 У16х= У 187; 
12а х 10 х--ё Ух’ = У (06х16 у). 


Из решения этой системы получаются формулы 
МЕ А ев 
ща - [У ву У ав х— Хехе и У и 


= [п У 08160 Ух Уи, 


где Р=л» (16 х)?— (5 16 х)? — определитель системы; л — число 
членов ряда регрессии; х н у — значения членов ряда независи- 
мой и зависимой переменных величин. Из этих формул следует, 
что для нахождения параметров аи 6 нужно предварительно 
рассчитать ХУ 18, > (159, 1х), ХІехи ХУ (10 х)?. 

Пример 19. Наблюдения за развитием самок павианов-гамад- 
рилов показали, что между массой их тела и длиной туловнща 
существует положительная связь. Соответствующие данные и их 
обработка приведены в табл. 130. 

Если эти данные изобразить в виде графика, как показано на 
рис. 37, можно убедиться в том, что между этими признаками 
имеет место нелинейная связь. Прологарифмировав значения пе- 
ременных х иуи выразив полученные величины в процентах от 
их общей суммы для каждого ряда в отдельности, легко постро- 
ить линейный график, показывающий, что точки 16у и 16х рас- 
полагаются на одной прямой (рис. 38). Следовательно, зависи- 
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Таблица 130 


Длина Масса 


тулови- | тела у, 16 х 160 18 х160 (16 х)? ГА 

ща х, см кг 
17 1,5 1.23045 0,17609 0,21667 1,51401 1,4 
19 2,0 1,27875 0,30103 . 0,38494 1,63520 1,9 
21 2,3 1,32222 0,36173 0,47829 1,74826 2,4 
23 3,3 1,36173 0,51851 0,70607 1,85431 3,1 
25 3,6 1,39794 0,55630 0,77767 1,95424 3,8 
27 4,4 1,43136 0,64345 0,92101 2.04879 4,6 
29 5,5 1,46240 0,74036 1,08270 2,13861 5,6 
31 6,0 1,49136 0,77815 1,16050 2.22415 6,7 
33 7,8 1.5185] 0,89209 1,35465 2.30587 7,8 
35 9,6 1,54407 0,98227 1,51669 2,38415 91 
37 12,0 1,56820 1,07918 1,69237 2.45925 11,6 

Сумма 58,0 15,60699 7.02916 10,29156 22.26684 58,0 


жость между этими признаками можно выразить уравнением 
тепенного типа. Найдем эмпирическое уравнение этой зависимо- 
ти. Вспомогательные величииы содержатся в табл. 130. Под- 
тавляя эти величины в формулы, находим 


са 7,02916.22,26684 — 10,29 О БР — 4,1031 —— 3,023; 
11.22,26684 — (15,60699)2 1,3571 
1,3571 1,3571 


)тсюда эмпирическое уравнение массы тела у по длине тулови- 
ца х самок гамадрилов имеет следующий ВИД; 


16 9,= 2,5816 х — 3,023. 


5 
у Е 
ГА = 
ВИ = 0 
ай З 2 
5 5490 
4 У 
2 5 20 
8 
и ин —Ш- “У 
ину 8 1200 и ва юш 


ГЕ тулища РМ /огорирмы массы тела 


?ис. 37. Зависимость между длииой Рис. 38. График регрессии мас- 
-уловища и массой тела у самок па- сы тела по длиие туловища у 
вианов-гамадрилов самок павнанов-гамадрилов 


293 


Подставляя в это уравнение вместо х конкретные данные о длине 
туловища самок гамадрилов, можно определить возможную мас- 
су их тела, соответствующую известной длине туловища. Напри- 
мер, длине туловища самки гамадрила, равной 28 см, должна 
соответствовать следующая масса ее тела: [2 ух=2,58 |228 — 
— 3,023 =2,58. 1,44716—3,023=0,711, или ух=5,0 кг. Рассчитанные 
таким образом ожидаемые величины массы тела ух самок гамад- 
рилов, соответствующие размерам туловища этих животных, 
приведены в последней графе табл. 130. Видно, что они неплохо 
согласуются с эмпирически найденными значениями этого ряда. 

Пример 20. По данным А. Д. Слонима и О. П. Щербаковой 
(1949), величина основного обмена обезьян, выраженная в ки- 
лоджоулях на | кг массы тела за 24 ч, изменяется с возрастом 
следующим образом (табл. 131). 

Как и в предыдущем случае, зависимость между этими при- 
знаками можио описать уравнением степенного типа. Основани- 
ем для этого служит тот факт, что точки |2 х и |2 у располагают- 
ся в системе прямоугольных координат на одной прямой (чита- 
тель может это проверить). Найдем эмпирическое уравнение 
регрессии величины основиого обмена у по возрасту обезьян х. 
Предварительно рассчитываем вспомогательные величины. Рас- 


Таблица 131 


Возраст м 2 
обезьян х, | обмен 16 х 7 168х160 (16 х)? их 
мес у 
2 1045 0,30103 3,01912 0,90884 0,09062 991 
4 673 0,60206 2,82802 1.70263 0,36248 703 
8 489 0,90309 2,68931 2,42869 0,81557 499 
9 451 0,95424 2,65418 2,53272 0,91057 471 
10 405 1,00000 2,60746 2.60746 1,00000 447 
16 485 1,20412 2,68574 3,23396 1,44990 355 
19 293 1,27875 2,46687 3,15451 1,63520 326 
20 318 1,30103 2,50243 3,25573 1,69268 318 
22 288 1,34242 2,45939 3,30154 1,80209 303 
28 268 1,44716 2,42813 3,51390 2,09427 269 


Сумма 4715 | 1033390 26,34065 26,63998 11,85338 


чет приведен в табл. 131. Подставляя найденные величины в 
формулы, определяем параметры: 


16а= 76,34065.11,85338 — 26 ,63998. 10,33390 3,145; 
10.11 ,85338 — (10,33390)2 
а 10.26 ,63998 — 10,33390-26,34065 = 0,40, 


10.11,85338 — (10,33390)2 
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этсюда эмпирическое уравнение регрессии основного обмена 7 
хо возрасту Х обезьян: 


16 9,==3,145 — 0,494 р х. 


Рассчитанные по этому уравнению ожидаемые величины ос- 
човного обмена в зависимости от возраста обезьян приведены в 
тоследней графе табл. 131. Видно, что они хорошо согласуются 
лежду собой, что более наглядно показано на рис. 39, где изо- 
эражены эмпирическая и выровненная линии регрессии У по Х. 


256 и в 202 258 
Возраст, месяцы 


?ис. 39, Эмпирическаи и вычислениая по уравие- 
ию степениой функции кривые возрастных изме- 
иений осиовиого обмена у обезьян 


егрессия, выражаемая уравнением логистической кривой. 
значительный интерес для биолога представляет логистическая 
‚ависимость между переменными величинами. Зависимость тако- 
^о рода встречается во многих случаях, например при изменении 
‘остава популяции в замкнутой среде обитания, когда начальное 
"исло особей сначала быстро возрастает, затем темп роста попу- 
‘яцин также быстро снижается и популяция переходит в состоя- 
тие динамического равновесия. Графически эта закономерность 
Ізображается в виде 5-образной кривой, которая описывается 
‘равнением Ферхюльста: 


М 
‘де у — учитываемый признак; #— время, прошедшее от началь- 
той, или базисной (с), величины признака, с которой начато его 
‘змерение, до предельной в данных условиях величины М, кото- 
зой он достиг за время #; аи $ — параметры уравнения, опреде- 
1яющие характер логистической кривой. 
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Путем логарифмического преобразования это уравнение при 
обретает следующее выражение: 


( М -1)=а+и. 
у— с 


Обозначив ( — 1 через г, получаем уравнение линейно! 


регрессии: 
1е2=а--Ы. (203 
Таблица 13: 
Я М. м1 = #1 
А у ї у у 16 2 62 
0 5 — — — == РЫР мк 
1 20 1 19,50000 18,50000 41,2672 |+ 1,2672 |--1,2672 
2 1100 4 3,90000 2,90000 -+0,4624 +-0,46924 |--0,9248 
3 |300 9 1,30000 0,30000 1,4771 —0,5229 |—1,5687 
4 | 350 16 1.11430 0,11430 1,0581 —0,9419 |--3,7676 
5 | 380 25 1,02630 0,02630 2,4200 — 1,5800 |--7,9000 
6 | 385 36 1,01299 0,01299 2,1136 | —1,8864 |—11,3184 
7 | 389 — — — — — — 
— — 91 — — — —3,2016 |--22,3627 


м 
кә 


Определению параметров а и 8 этого уравнения удовлетворяе” 
следующая система нормальных уравнений: 


ап-- 6 = У 2; 
а У:--6 Р-У). 


Решая эту систему относительно параметров а и 6, получаем сле: 
дующие формулы: 


а= 58-5 я] 
=> 2 Уә У: УЕ2|, 


где О =пУ2— (51)2, 

Из этих формул следует, что для получения эмпирическог‹ 
уравнения логистической зависимости между переменными ѓи; 
необходимо предварительно рассчитать Яі, Ўй, Ў 1р2 и ХУ (Нда, 
Затем, определив параметры 2 и Ё, найти для каждого значения 
і (в пределах учитываемого промежутка времени) величины 162 
и г, что и приведет к нахождению ожидаемых значений у:. 
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Пример 21. На протяжении семи суток проводили наблюде- 
тия над ростом численности особей инфузории туфельки в замк- 
гутой среде обитания (аквариуме). Результаты опыта и их об- 
‚аботка приведены в табл. 132. 

Наблюдения начаты с помещения в аквариум пяти особей ту- 
оельки. К концу первых суток их численность увеличилась в 4 
›аза, затем в 5 раз ит. д. 

Принимая с=0 и №= 390, составляем систему нормальных 
'равнений: 


6а--216 = — 3,2016; 
2104-9160 = —22,3627, 


?ешая эту систему, находим 


а—=——= 82016.91 21 (—22,8627)_ 178,271 | 6978.1 698; 
6-91 — 21.21 105 
== 6 — 22,3627 — 21 ( — 3,2016) ЖЕ — 134,1762 — 67,2336 — 0,6375. 
105 105 


?тсюда эмпирическое уравнение, выражающее закономерность 
юста численности особей популяции туфельки в замкнутой сре- 
{е обитания, оказывается следующим: 


- 390 
ЕТ 


Это уравнение позволяет определять ожидаемую численность 
собей туфельки ў; в любой момент ее развития в замкнутой сре- 
е обитания. Для простоты следует логарифмировать уравнение 
тоямой 2=а-- 9$, затем с помощью таблицы логарифмов найти 


М 
‚начения 2= ——1, а также 2+1. Делением М на 2-1 получа- 
у 
этся искомые величины у.. В отношении рассматриваемого при- 
хера эти вычисления выглядят так (табл. 133). 


Таблица 133 


№ = 
і є 2=а+Ы 162 РА | 2+1 | и 
0 -+-1,698 -+-1,698 49,900 50,900 8 
1 41,061 41,061 11,510 12,510 31 
2 40,424 0,424 2,650 3,650 107 
3 —0,213 1,787 0,612 1,612 242 
4 —0,850 1,150 0,142 1,142 342 
5 —1,488 2,512 0,032 1,032 378 
6 —2,124 3,876 0,0075 1,0075 387 
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При сопоставлении эмпирически полученных величин 7; с вы- 
численными у; видно, что они неплохо согласуются между собой. 
Более наглядно об этом свидетельствует рис. 40, на котором на 
фоне ломаной эмпирической кривой изображена плавно идущая 
кривая ожидаемых значений у; переменной Ү!. 


1Х.3. ОЦЕНКА ДОСТОВЕРНОСТИ ПОКАЗАТЕЛЕЙ РЕГРЕССИИ 


Выборочные показатели регрессии являются оценками соот- 
ветствующих генеральных параметров и, как величины случай- 
ные, сопровождаются статистическими ошибками. Ошибку выбо- 
рочного коэффициента рег- 
рессии У по Х определяют 
по формуле 


аре Гат (и: — 0) 
(204) 


а ошибку коэффициента рег- 
Г 1 20а 5 68 рессии Х по Ү — соответст- 


Численность популяции 


Время, сут венно 
расани 
Рис, 40. сои числениости попу- 5, (1—02) Ў (х 0 
ляции инфузории туфельки в замкиутой „=уУ ие 
среде обитания ё (п — 2) У (и – у)? 
(204а) 


Достоверность выборочных коэффициентов регрессии оцени- 
вают с помощью {-критерия Стьюдента. Нулевую гипотезу отвер- 
гают на принятом уровне значимости (а) с числом степеней сво- 
боды &=п—2, если фр. 

Пример 22. В гл. УП было установлено, что между массой те- 
ла новорожденных гамадрилов у; и массой тела их матерей х су- 
ществует положительная связь (г„,=0,564). Уравнение регрес- 
сии, описывающее эту связь, следующее: 


у,=0,42-1- 0,024х. 
Определим ошибку коэффициента регрессии бу= 0,024 и оценим 
достоверность этого показателя. Необходимые данные содержат- 
ся в табл. 96: п=20; Ху= 14,06; Ух=237,4; Уу2=9,9596 и Ух? = 
=2861,60. Рассчитаем девиаты: 
р,=У(и-у=Уи—- 1 — 9,9596 (90602 0,0754; 


п 


1 
Более подробно этот способ описан в книге Н. А. Плохииского «Бно- 
метрня» (1970). Там же приведены способы выравиивания других видов 
нелинейной регрессии, в частиости регрессии периодического типа. 
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=. (237,4)? _ 7 
р.= (х9) = У — =—=2861,60— —5—==48,66; 


= 1205680079 1—0,5642-0,0754 уз 0,052 0000066 —0,008. 


(20 — 2) 43,662 785,916 


Критерий %=0,024/0,008 =3,0. Эта величина превосходит крити- 
ческую точку #1=2,88, для =20—2 и а= 1%, что дает основание 
для непринятия нулевой гипотезы. 

Если исходные данные сгруппированы в вариационные ряды, 
а их частоты распределяются по ячейкам корреляционной табли- 
цы, ошибку коэффициентов регрессии определяют с учетом клас- 
совых интервалов по следующим формулам: 


м/т вА; арз 
$ == , $ ——— = 2 5 
вх 5А ү п— 2 ?ху $ п-2 (20 ) 
Пример 23. Выше были найдены характеристики корреляци- 
онной зависимости между массой тела У и годовым удоем Х ко- 
ров горбатовской породы гху=0,523; 6,«=0,0564, а также $у== 
==3,272; 5,=2,843, классовые интервалы: А,=14 и №= 152, Вы- 


числим ошибку коэффициента регрессии удоя коров по живой 
массе их тела: 


затем И 1—0.523 1 106.0,086 —0,0091. 


ух 0 843-152 100—2 
Критерий += т =6,19>1=3,29 для &=100-2=98 и а= 


=0,1%4. Нулевую гипотезу отвергают на высоком уровне значи- 
мости (Р< 0,001). 

Эмпирические уравнения регрессии также сопровождаются 
ошибками. Последние, обозначаемые символами $ух и $ху, могут 
быть рассчитаны по формулам 


— 1 
А рна а - (206) 
м Уат; о) 
Уши (кр) 
Е а! Бота К. а 
(207) 


где ух и Ху — частные средние переменных Уи Х; п—2 — число 
степеней свободы. 

Значения 5ху И 5ух также называют частными, парциальными 
или остаточными средними квадратическими отклонениями. Они 
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описывают величину изменчивости отдельных наблюдений по от- 
ношению к линии регрессии, т. е. частным средним ӯ, (или Ху, 
составляющим эту линию. Величина $ух ИЛИ 5х, позволяет судит: 
насколько можно ошибиться, пытаясь найти значение признакг 
у или х как значение частной средней, полученной по уравненик 
регрессии. 

Пример 24. Зависимость между массой тела у и возрастом : 
детенышей макак-резусов в первый год их жизни описываетс; 
уравнением линейной регрессии ух =1,20--0,1104 (х—х). Опреде 
лим ошибку для этого уравнения. Необходимые данные содег 
жатся в табл. 117. Расчет величины Х(у:—у»х)? приведен і 
табл. 134. 

Таблица 13- 


Масса тела детенышей, кг 


Ая Е ( а 
а Ей фактическая у вычислеиная у, У: Их У:—Ух 
1 0,53 0,59 0,06 0,0036 
2 0,71 0,70 0,01 0,0001 
3 0,79 0,81 0,02 0,0004 
4 0,98 0,92 0,06 0,0036 
5 1,06 1,03 0,03 0,0009 
6 1,18 1,14 0,01 0,0001 
7 1,25 1,26 0,01 0,0001 
8 1,43 1,37 0,06 0,0036 
9 1,51 1,48 0,03 0,0009 
10 1,59 1,59 0,00 0,0000 
И 1,65 1,70 0,05 0,0025 
12 1,77 1,81 0,04 0,0016 


Подставляя известные величины в формулу (207), находим 


би и -0,0174_ 70:00174 ==0,042. 
12—2 

Если исходные данные сгруппированы в виде корреляционної 
таблицы, ошибку уравнения регрессии вычисляют с учетом час 
тот ряда распределения, т. е. вместо У (х;—2,)? нужно брат: 
У}, (х:—Хи)?, а вместо Ў (и;—0;)? следует находить Ў, (у;—0,)° 

Случайная вариация отдельных частных средних у», принад 
лежащих линии регрессии, зависит от величины остаточной вг 
риации признака У, т. е. от 5;х, объема выборки п, по которо? 
оценивали регрессионную связь, и от того, насколько далеко о” 
средней 1 отстоит значение х, для которого по уравнению регре‹ 
сии ух=@-+5х была найдена величина ух. Квадратическая ошиб 
ка частной средней может быть получена по формуле 


1 (х — х)? 
йет ц 
Ух и} п п5? 5 


300 


а доверительный интервал может быть задан выражением 


у, 15’ 


где Ёзависит от числа степеней свободы Ё=и—2 и от принятого 
уровня значимости а. 

Иногда практический интерес может представлять построение 
доверительного интервала для отдельных наблюдений, например 
если требуется очертить зону, включающую в себя определенный 


Таблица 135 


Длина тела х; Обхват груди У, (х;—х)/8, ўр СР | И + у, 
148,5 80,5 —2,95 73,2 87,8 
150,5 81,1 —2,58 73,8 88,4 
152,5 81,6 —2,22 74,3 88,9 
154,5 82,1 —1,85 74,8 89,4 
156,5 82,7 —1,48 75,4 90,0 
158,5 83,3 —1,12 76,0 90,6 
160,5 83,9 —0,76 76,6 91,2 
162,5 84,5 —0,38 77,2 91,8 
164,5 85,0 —0,02 77,7 92,3 
166,5 85,6 0,35 78,3 92,9 
168,5 86,2 0,71 78,9 93,5 
170,5 86,7 1,08 79,4 94,0 
172,5 87,4 1,45 80,1 94,7 
174,5 87,9 1,81 80,6 95,2 
176,5 88,6 2,18 81,3 95,9 


(роцент всех эмпирических наблюдений, располагающихся возле 
тинии регрессии. В этом случае может быть использована форму- 
за квадратической ошибки отдельного наблюдения 


ЕСТЕ БЕС В 
бу, == ут и А 


х 
‹ доверительный интервал будет иметь границы 


Ух 15, 


‘де ѓ имеет А=и—2. Следует заметить, что границы доверитель- 
зого интервала для разных значений х будут расширяться в той 
тере, в какой эти значения будут отличаться от среднего уров- 
ях. 

Пример 25. По данным примера с нахождением уравнения ре- 
‘рессии длины тела Х и обхвата груди Ү найти доверительный 
єнтервал для индивидуальных значений, включающих 95% всех 
заблюдений. Воспользуемся для этого регрессией У по Х. Исход- 
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ными данными для примера являются значения ў = 164,6; 5,= 
=4,04; 5.= 5,46; гх,=0,391 и п=727. 

Сначала найдем остаточную дисперсию признака У. Она рав- 
на 5,,=4,04 УТ 0,3912(726/725)==3,72. Затем требуется най- 
ти нормированные отклонения для середин классовых интервалов 
по признаку Х. Эти значения приведены в табл. 135. После это- 
го для каждого классового интервала находим квадратическую 
ошибку $у,, на основании которой легко рассчитываются грани: 
цы доверительного интервала. 

Например, для первого класса эти границы определяют сле- 
дующим образом. Квадратическая ошибка отдельного наблюде- 


ния $, ==3,72 14. 177927 4-(— 9,95)2/727 =3,74. Нижняя граница 


доверительного интервала равна 80,5-—1,96:3,74= 73,2, а верхняя 
его граница равна 80,5 - 1,96. 3,74= 87,8. Границы доверительного 
интервала для отдельных наблюдений в соответствии с линией 
регрессии обхвата груди У по длине тела Х приведены на рис. 41. 
Эти границы можно считать своего рода нормативом формы тела, 
Если некоторое наблюдение окажется на графике расположен- 
ным ниже нижней границы, то для такого индивида можно кон- 
статировать нетипичное сочетание значений двух признаков, 
когда обхват груди по отношению к длине тела характеризуется 
весьма слабым развитием. 


у 
96 


92 


< 
< 


ви 


80 


> 


Окружность груби, см 


З 


150 150 198 167 165 т 17 Хх 
Рост, см 


Рис. 41. Довернтельная зоиа регресснн окружностн грудн У 
по росту Х мужчни, включающая 95% всех иаблюдеинй 
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Следует также отметить еще одно обстоятельство, проявив- 
шееся в данном примере. В общем случае доверительные грани- 
цы отдельных наблюдений должны расширяться по мере удале- 
ния значений признака Х от центральной точки. Однако этот эф- 
фект будет выражен тем больше, чем меньше окажется объем 
выборки. В данном случае этот объем достаточно велик и грани- 
цы доверительного интервала обнаруживают весьма слабую кри- 
волинейность. Так, для первого классового интервала ширина 
границ 87,8—73,2 = 14,6, тогда как для центрального класса она 
составляет 92,3—77,7 = 14,6. Это объясняется тем, что объем вы: 
борки достаточно велик, что обусловливает небольшую величину 


а Г Е)? 
значений радикала о еагуане ‚ учитывающего сте- 
п пѕ 
х 


пень отклонения точек х; от центра =. 

Решая такую задачу, следует иметь в виду, зто использование 
уравнений линейной регрессии допустимо лишь в тех случаях, 
когда исходные данные распределяются нормально или же их 
распределение не очень сильно отклоняется от нормальной кри- 
вой. Если же генеральная совокупность, из которой извлечена 
выборка, распределяется по другому закону, применять уравне- 
ние линейной регрессии к нормативным оценкам варьирующих 
объектов нельзя. В таких случаях более подходящими будут ие: 
параметрические оценки, в частности перцентильные, о которых 
шла речь выше. 


1Х.4. ВЫБОР УРАВНЕНИЙ РЕГРЕССИИ 


Важной задачей в области регрессионного анализа является 
выбор уравнения, которое бы наилучшим образом описывало ис- 
следуемую закономерность. Обычно эту задачу решают следую- 
щим образом. Эмпирический ряд регрессии или динамики, для 
которого подыскивают наилучшее корреляционное уравнение, 
изображают в виде точечного графика в системе прямоугольных 
координат. Если эмпирические точки располагаются на одной 
прямой или могут быть аппроксимированы прямой линией, зави- 
симость между переменными величинами описывают уравнением 
линейной регрессии. Труднее выбрать наилучшее уравнение ре- 
грессии при наличии нелинейной связи между переменными вели- 
чинами. В таких случаях подходящее уравнение подбирают на 
основании сравнения эмпирического графика с известными об- 
разцами кривых. Немаловажное значение при выборе уравнения 
регрессии имеют личный опыт и профессиональные знания иссле- 
дователя. Иногда форма связи между переменными У и Х сама 
по себе подсказывает выбор наилучшего уравнения регрессии. 
Примером может служить лактационная кривая или кривая, от- 
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ражающая закономерность возрастания численного состава по- 
пуляции в замкнутой среде обнтания и т. п. явления. 

Графический анализ не гарантирует от возможных ошибок, 
особенно в тех случаях, когда главное направление регрессии 
или динамики (их тренд) снльно затушевывается колебаниями 
членов ряда. Поэтому наряду с графическим анализом применя- 
ют и аналитические способы проверки правильности выбора 
корреляционных уравнений. 

Одним из них является применение принципов дисперсионно- 
го анализа. Неадекватность линии регрессии, найденной теорети- 
ческим способом по отношению к эмпирической линии, может 


2 
быть описана суммой квадратов отклонений 22 ъ= У (85 — 2.) А 


Случайная вариация наблюдений у;; по отношению к условным 
средним ух, ‚ найденным эмпирически, определит девиату 


2:=У У (0-5). Здесь для различения эмпирических и 


теоретических условных средних использованы обозначения: ГЕЯ , 


для первой и Их, для второй. По каждой из девиат может быть 
найдена соответствующая дисперсия. Так, дисперсию неадекват- 


ности регрессионной модели находят по формуле 


| 
НИР ВИЙ 
к а—т * 


где а — число классовых интервалов, для которых находили эм- 
пирические средние #,; т — число параметров, определяемых 
в регрессионной модели. Это количество для прямолинейной ре- 
грессии равно двум, для квадратической параболы — трем и т. д. 
Остаточная дисперсия может быть получена по формуле 


па 


Сравнение двух дисперсий осуществляют по Ё-критерию Фишера 
(Ё =8һ2/5,2) с числами степеней свободы А! =2а—7т и Ё=п—а. 
Характерно, что для случая проверки неадекватности прямо- 
линейной регрессии величина Р-критерия сводится к выражению 
2 2 
Е Е Вох — Гух п-—а 
2 565 ЫЈ 
1-м, 2—2 
которое полностью совпадает с уже известным критерием пря- 
молинейности корреляционных связей. 
Однако при работе с непрямолинейными уравнениями ре- 
грессии эта формула оказывается неприменимой, и следует поль- 
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зоваться непосредственным определением девиат неадекватности 
и остаточной случайной изменчивости. Это осуществляется сле- 
дующим образом. 

Пусть по признаку Х существует группировка (вариационный 
ряд), включающая а классов, в каждом из которых содержится 
Ј., наблюдений. Пусть теперь в каждом классе признака Х по 


значениям признака У определена условная средняя Ух) = 
та 
| 
У у:}. Здесь суммирование производят по всему коли- 

Гр 
честву наблюдений, попадающих в і-й класс. Совокупность ус- 
ловных средних ух, в зависимости от значений х; (центральных 
значений классового интервала) составит эмпирическую линию 
регрессии У по Х. Пусть теперь найдена теоретическая линия 
регрессии й„=|(х) и определены теоретические значения услов- 
ных средних для каждого интервала по признаку Х. 

В соответствии с принципами дисперсионного анализа необ- 
ходимо найти две девиаты: Да? — неадекватности регрессии и 
р? — остаточную. Для проведения вычислений удобнее восполь- 
зоваться простыми формулами 


< с 2 —2 
2:=У, У — ах: ; 
121 71 


а 
р я \2 
= У а (9 — У) * 
1-1 


Согласно одиой из них, для каждого интервала находится раз: 

ность двух значений условных средних ук и ПРЕ ‚ которую воз: 

водят в квадрат и домножают на число наблюдений Гањ Сумми- 

рование производят по всем а классовым интервалам. Согласно 

второй формуле, для каждого класса вычисляют сумму квадра- 

тов значений признака у (> и, ‚ свойственных тем наблюде- 
а 


ниям, которые оказались в этом классе. Затем для каждого ин- 
2 
тервала находят величину У, 0, Ў.Ухр после чего все эти а 
ј 


значений суммируют. Делением на числа степеней свободы Ав = 
=а—т и Ё =п—а получают искомые дисперсии, сопоставляемые 
в рамках Ё-критерия Фишера. Если Ёф превысит табличное зна- 
чение Ё;г, найденное для Ан и А, а также выбранного уровня зна- 
чимости а, то необходимо будет признать, что предположение об 
адекватности построенной теоретической регрессии следует от- 
клонить и попытаться испытать иную модель. В противном слу- 
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чае (Еф<Е,:) можно считать, что неадекватность проверяемой 
линии регрессин оказалась недоказанной, поэтому ее можно 
использовать. 

Дисперсионный анализ применим не только к оценке рядов 
регрессни, но и рядов динамики, которые рассматривают как 
односторониие регрессии. Например, на рис. 29 показано, что на 
протяжении 9-летнего периода оценки знаний студентов по курсу 
дарвинизма варьировали. Возникает вопрос: правильно ли вы- 
брано уравнение линейной регрессии для описания этого ряда? 
Читателю предлагается ответить на этот вопрос самостоятельно. 
Нужные данные содержатся в табл. 118. 

В заключение этой главы необходимо отметить: уравнения 
регрессии позволяют прогнозировать возможные значения зави- 
симой переменной на основании известных величин аргумента. 
При этом, однако, не следует экстраполировать регрессию за 
пределы проведенных опытов, так как она может менять свое на- 
правление. Область применения уравнений регрессии лучше ог- 
раничить теми данными, на которых получены эмпирические 
уравнения. Это предостережет исследователя от возможных 
ошибок. 

Не следует также при отыскании эмпирических уравнений ре- 
грессии и динамики допускать значительные сокращения прибли- 
женных чисел. Округлять числа следует лишь после того, как 
закончены расчеты вспомогательных величин. 


ГЛАВА Х 
ВОПРОСЫ ПЛАНИРОВАНИЯ ИССЛЕДОВАНИЙ 


Классические работы Р. Фишера открыли новую страницу в 
истории биометрии: они показали, что планирование эксперимен- 
тов и обработка их результатов — это две тесно связанные меж- 
ду собой задачи статистического анализа. Это открытие легло в 
основу разработки теории планирования экспериментов, которая 
в настоящее время находит применение не только при проведе- 
нии сельскохозяйственных опытов, на базе которых она возникла, 
но и в различных областях биологии, медицины, антропологии, 
в сфере других научно-практических дисциплин, включая и со- 
циально-экономические исследования. 

Планирование экспериментов, как уже отмечалось в пре- 
дисловии к этой книге, стало самостоятельным разделом био- 
метрии, которому посвящена огромная литература. В началь- 
ном курсе биометрии невозможно осветить все аспекты теории 
экспериментов. Здесь будут рассмотрены лишь некоторые об- 
щие положения, относящиеся к этой сложной и многогранной 
проблеме, 
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Термин «эксперимент» (от лат. ехрегітепіишт — опыт) означа- 
ет искусственно организуемый комплекс условий, в которых ис- 
пытывают воздействие того или иного фактора или одновременно 
нескольких факторов на результативный признак. В земледелии 
это полевые опыты; в животноводстве — опыты по кормлению жи- 
вотных, по уходу за ними; в педагогике — опыты по проверке но- 
вых методов обучения и воспитания учащихся; в фармакологии — 
испытание эффективности новых лечебных препаратов; в меди- 
цине — проверка разных способов лечения больных и т. д. 

Исследовательская работа не только сводится к эксперимен- 
там; ее проводят и вне их на основе непосредственных наблю- 
дений. Так что выражение «планирование исследований» ока- 
зывается более емким, а следовательно, и более подходящим, чем 
введенный Р. Фишером (1930) термин «планирование экспери- 
ментов». Конечно, и термин «эксперимент» можно применять в 
более широком смысле, понимая под ним любые испытания, про- 
водимые исследователем в отношении изучаемого объекта, При 
всем разнообразии методов исследовательской работы задача 
планирования сводится к тому, чтобы при возможно минималь- 
ных объемах наблюдений получать достаточно полную инфор- 
мацию об изучаемых объектах. 

С варьированием результатов наблюдений связана повторность 
вариантов опыта, позволяющая повысить точность оценок гене- 
ральных параметров, надежность выводов, которые делает иссле- 
дователь на основании выборочных.показателей. Под повторнос- 
тью в полевом опыте понимают число одноименных делянок для 
каждого варианта опыта. В лабораторных условиях повторность 
может выражаться числом одинаковых проб серий одновремен- 
ных испытаний, измерений и т. п. повторений одного и того же 
варианта опыта. Очевидно, чем шире диапазон варьирования 
признака, тем больше должна быть и повторность опыта, и, на- 
оборот, при слабом варьировании учитываемого признака число 
вариантов опыта, т. е. их повторность, уменьшается, В такой же 
зависимости от размаха варьирования признаков находится и 
организация планирования минимально допустимого числа ис- 
пытаний. 


Х.4. ПРИБЛИЖЕННЫЕ ОЦЕНКИ ОСНОВНЫХ 
СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ 


Прежде чем наметить необходимый объем выборки, надо оп- 
ределить среднюю величину и ее ошибку для варьирующего при- 
знака — характеристики, которые позволяют использовать пока- 
затель точности выборочной средней при решении этой задачи. 
Приближенное значение средней арифметической х можно опре- 
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делить по полусумме лимитов: 


ха ла, (208) 
2 
а среднее квадратическое отклонение 5; — по разности лимитов, 
отнесенной к коэффициенту К, который устанавливают в зависи- 
мости от объема выборки (л) с помощью табл. 136 (по Н. А. Пло- 
хинскому, 1970), т. е. по формуле 


Хтах — Хті 
$.= тах ша 5 (209) 
К 
Пример 1. Зная лимиты хиш=9,0 мгф и Хшах=14,7 мг% 
кальция в сыворотке крови обследованной группы обезьян (п= 
=100), можно определить основные характеристики для этой вы- 
борки: 


- _ 9,0 --14,7 
мо 
2 


14,7 — 9,0 


==: 11,85 мг % и 5,= = 1,14. 


Эти величины близки к фактически найденным: 2 = 11,94 мгф и 
5$«==126. 


Таблица 136 


16—49 | 50—200 


в | 2—5 І 6—15 


201—1000 | >1000 


С ОСИ Е 


Величину ошибки средней $; можно определить по следую- 
щей приближенной формуле: 
_— _ тах — Ха 
14,7 —9,0 
5У 100 
получается и при использовании основной формулы 5; == у 
1,14 


ты Отсюда показатель точности С5$ выборочной 


а 5: 0.114 
средней х Сз=100— = 100 " 

х 
точность. Намечаемый таким образом объем выборки можно 
считать вполне достаточным для получения надежных оценок 
генеральных параметров (при условии , что совокупность, из ко- 
торой взята выборка, распределяется по нормальному закону). 
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Так, в данном случае 5: == =0,114. Эта же величина 


$х 015 
п 


==0,96. Это очень высокая 


Х.2. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ 


Элементарная логика и практический опыт подсказывают, что 
неразумно стремиться к неоправданно большому числу испыта- 
ний, если убедительный результат можно получить при мини- 
мально допустимом объеме выборки. Необходимая численность 
выборки л, отвечающая точности, с какой намечено получить 
средний результат, зависит от величины ошибки выборочной сред- 
ней и определяется по формуле 


п—=—Ф* ИЛИ (211) 
д2 
ѓ2 Ё \2 . 
п = =! — ў 212 
42/52. (5) 209) 


где ѓ — нормированное отклонение, с которым связан тот или 
иной уровень значимости (а); $. — выборочная дисперсия; А= 
=1{5. — величина, определяющая границы доверительного интер- 


вала (здесь ЕЕ —^ — ошибка выборочной средней); К= 


=А/5х. 
Пример 2. Случайная выборка девяти вариант характеризует- 
ся средней д =12,1-0,68. Точность выборочной средней оказа- 


лась недостаточно высокой: С$==100 1" =5,62=6. Какое чис- 


, 


ло испытаний п нужно провести, чтобы ошибку средней умень- 


шить вдвое? В данном случае 5.==5%У и==0,68 У 9= 2,04. 
Примем #=1,96=2, что соответствует 5%-ному уровню значи- 


мости. Предварительно определим А= 2 = (0,68; К = 


ВН: Подставляем найденные величины в формулу 


2,04 
(212): п= (2/0,33)2 =6?=36. 

Чтобы уменьшить ошибку репрезентативности вдвое, нужно 
объем выборки увеличить в четыре раза (9.4=36). Обобщая 
эти данные, можно сделать вывод: для уменьшения ошибки вы- 
а средней в К раз нужно увеличить объем выборки в 

раз. 

При определении необходимого объема выборки для получе- 
ния статистически достоверной разности между средними 
(71—22) =4 применяют формулу 


2 
і \2 51 :\ 
по=| — | |-- $]. 213 
(=) | 2-9 (213) 
Здесь Л = 154, где 54 — заданная величина ошибки для разности 


сравниваемых средних; $1? и 55? — дисперсии для сравниваемых 
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выборок, причем 5$:?— дисперсия для большей выборки; а= 
= п/п — отношение объема большей выборки к объему мень- 
шей выборки. При п, =и2 формула (213) принимает следующий 
вид: 


(<) (8-55), (214) 


Пример 3. Изучали влияние лечебного препарата на массу 
тела лабораторных мышей (см. пример 2 гл. У). Были получе- 
ны следующие результаты. Характеристики опытной группы 
(п1= 9): 


2 =74,1 г; я — 87,86; 


контрольной группы (п2=11): 


Х,-68,8 г; ав 44,36. 


Разность между х. и Хо, равная 5,3+2,89, оказалась стати- 
стически недостовериой. Определим число наблюдений п, кото- 
рое необходимо провести при уменьшении ошибки разности 
вдвое, т. е. $4=2,87/2 = 1,445. Примем {=2. Имеем а=11/9=1,222 


иА=2.1,445=2,89, Отсюда п 2 у --+37,861) == 


2,89 1,222 
= 35,52-=36. 
При альтернативной группировке данных, когда числениость 
выборочных групп выражают в долях единицы, планируемый 
объем наблюдений определяют по формуле 


псы АКЕ (215) 
Д2 


где р -—– доля вариант, обладающих данным признаком; Л = $. 
Если доли выражают в процентах от общего числа наблюде- 
ний, формула (215) принимает следующий вид: 


=-2рОЮ- р. (216) 
А2 


Пример 4. По предварительным данным, число гельминтоно- 
сителей среди лиц, проживающих в №-м населенном пункте, рав- 
но 8$. Определить необходимое число наблюдений, при котором 
величина максимальной ошибки А не превысит 4% для уровня 
значимости, равного 0,05, и соответственно ѓ= 2. 

Подставляя известные значения в формулу (216), находим 
ра 22:80100 — В) _ 29 урд 


ПОСЛЕСЛОВИЕ РЕДАКТОРА 


Объем сведений по биометрии, рассматриваемый в данном 
учебном пособии, касается главным образом классической си- 
туации, когда анализируют отдельный признак или несколько 
признаков, каждый из которых рассматривают отдельно от дру- 
гих. Вместе с тем в последних главах, где описаны методы кор- 
реляции и регрессии, по сути дела, вскрываются возможности 
биометрического анализа одновременно двух переменных. Даль- 
нейшее развитие теории корреляции позволило разработать так 
называемые методы многомерной статистики, которые для биоло- 
га могут считаться составляющими особый раздел биометрии — 
многомерной биометрии, рассматривающей способы анализа из- 
менчивости не одного отдельного признака, а целых их комплек- 
сов. 
В рамках небольшого послесловия можно дать лишь краткий 
вводный обзор многомерных методов и отослать читателя к су- 
ществующей специальной литературе, часть которой написана 
достаточно доступно для знакомящихся с этим предметом впер- 
вые, 

Среди признаков, имеющих различную форму варьирования, 
многомерные методы лучше разработаны для количественных пе- 
ременных, тогда как приемы анализа качественных показателей 
интеисивно разрабатывают лишь в течение последних двух деся- 
тилетий. Поэтому основное изложение будет касаться первых из 
НИХ. 

Когда исследователь имеет в своем распоряжении набор из т 
признаков, то в качестве характеристик, описывающих располо- 
жение некоторой анализируемой совокупности наблюдений на 
осях измерений этих признаков, можно получить 11 средних ариф- 
метических величин х;, которые записывают в виде строки 


Бонне) 


называемой вектором средних и являющейся многомерным ана: 
логом средней арифметической величины. Иными словами, в мно- 
гомерной статистике вектор средних играет такую же роль, как 
и средняя арифметическая величина в одномерной биометрии. 
Для любой пары признаков в качестве показателя тесноты их 
статистической взаимозависимости может быть найдено значение 
коэффициента корреляции г или ковариация сои. Если будут 
найдены все характеристики, которые можно получить для набо- 
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ра т признаков, то их можно записать в виде таблиц 


1 га газ Еге Гут 
го 1 723 ‘а Гот 
"3 гз 1 бе зт 
гіт т зт 2 1 а 
а также 

т $12 С0015 СО001з эт СО т 
С01о 522 6093 га СОбат 
с0013 С0003 532 АЯ со0зт 
еб 249 р ЧАР 07, 

1 Соот СО0от СО0зт ха 5% 


первая из которых называется корреляционной матрицей, а вто- 
рая — ковариационной матрицей и включает в себя также значе- 
ния т дисперсий признаков 5:2, располагающиеся на диагонали 
таблицы. Эти две матрицы описывают закономерности изменчи- 
вости и коррелированности признаков, которые можно обнару- 
жить для их набора. Ковариационная матрица является много- 
мерным аналогом дисперсии признака и играет в многомерной 
статистике такую же роль, что и дисперсия признака в обычной 
биометрии. | 

В соответствии с двумя элементами описания изменчивости 
набора признаков (вектором средних и ковариационной матри- 
цей) многомерные статистические методы грубо можно разделить 
на три крупных класса. 1. Приемы, которые позволяют решать 
задачи, аналогичные рассматриваемым в одномерной биометрии. 
2. Методы анализа внутригрупповой изменчивости, когда струк- 
туру ковариационной или корреляционной матрицы исследуют с 
целью выявления и интерпретации закономерностей соотноситель- 
ной изменчивости и коррелированности признаков. 3. Методы 
анализа межгрупповой изменчивости, когда сопоставляют векто- 
ры средних, найденные для нескольких выборок. 

‚ Следует заметить, что обычные алгебраические символы в 
применении к многомерной статистике становятся малоконструк- 
тивными и не позволяют строить по формулам, выписанным в 
этих символах, вычислительные алгоритмы. Поэтому основным 
математическим аппаратом многомерной биометрии является 
матричная алгебра, которая позволяет записывать формулы в 
очень компактном виде и получать по ним алгоритмы вычисле- 
ний, Для использования тех многомериых статистических мето- 
дов, которые могут быть интересны для биолога, достаточно оз- 
накомления лишь с элементарными сведениями из теории матриц, 
которые почти всегда приводят как приложение к книгам по 
многомерной статистике, 
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Второе обстоятельство, которое следует учитывать, касается 
вычислительных аспектов многомерной статистики. Действия 
над векторами и матрицами в основном несложиы, хотя и трудо- 
емки. Отдельные матричные вычисления (нахождение определи- 
телей, обратных матриц, собственных чисел и векторов) часто 
описываются в книгах по многомерной статистике [4, 11, 17] 1, 
где даны рекомендации либо по ручному счету с применением 
калькуляторов, либо по составлению программ для ЭВМ. Мат- 
ричные операции, как правило, входят в программное математи- 
ческое обеспечение современных компьютеров. 

Многомериые методы — аналоги одномерных. Среди таких 
приемов анализа многомерных данных наибольшее значение име- 
ют проверки статистических гипотез по отношению к векторам 
средних и ковариационным матрицам, которые получены по двум 
или нескольким выборкам, извлеченным из двух или нескольких 
генеральных совокупностей. Так, при двух выборках проверку 
достоверности различий векторов средних осуществляют при по- 
мощи так называемого 72-критерия Хотеллинга, похожего по кон- 
струкции на свой одномерный аналог — {-критерий Стьюдента. 
При наличии нескольких выборок, в которых найдены векторы 
средних, их однородность проверяют с применением многомерно- 
го аналога дисперсионного анализа. Для межвыборочной измен- 
чивости определяют межгрупповую ковариационную матрицу, 
которую сопоставляют с такой же внутригрупповой матрицей в 
конструкции специального критерия, например критерия Уилкса. 
Это аналогично сравнению двух дисперсий (межгрупповой и внут- 
ригрупповой), аналогами которых являются эти ковариационные 
матрицы. 

При использовании других многомерных методов очень рас- 
пространенным является прием нахождения некоторого нового 
признака у на базе набора исходных переменных х; в виде линей- 
ной конструкции 


ам сом... СХ: (*) 


Коэффициенты с; вычисляют таким образом, чтобы обеспечить 
признаку у определенные желаемые свойства, которых не име- 
ют признаки х:. Например, для разделения двух генеральных 
совокупностей (двух подвидов животных, больных и здоровых 
людей и т. д.) по комплексу признаков х коэффициенты с; долж- 
ны быть найдены так, чтобы у имел минимальную трансгрессию 
своих величин в этих генеральных совокупностях. Значения ко- 
эффициентов с; у разных признаков позволяют интерпретировать 
смысл, который имеет новый признак у, т. е. описать те комплек- 


1 Цифрами в квадратиых скобках указаны литературиые источники в 
списке рекомендуемой литературы к послесловию редактора, 
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сы значений переменных х, которые свойственны его большим и 
малым величинам. 

Методы анализа внутригрупповой изменчивости. Приемы мно- 
гомерного анализа данных, относящиеся к этому разделу, на- 
правлены на выявление закономерностей внутригрупповой вариа- 
ции и коррелированности больших наборов переменных х. 

Наиболее близок к традиционно используемым методам пар- 
ной корреляции и регрессии раздел, включающий в себя множе- 
ственную корреляцию и регрессию, который кратко рассмотрен 
в настоящем пособии. Уравнение множественной регрессии мож- 
но рассматривать как линейную конструкцию типа (*), позволя- 
ющую находить на базе большого набора исходных признаков х 
такую новую переменную, которая была бы максимально скор- 
релирована с (т--1)-м признаком хи. Эта корреляция называ- 
ется множественной. По значениям коэффициентов с;, которые в 
данном случае являются коэффициентами множественной регрес- 
сии, можно из всего набора т признаков х выделить только п из 
них, которые обнаруживают наибольшие значения этих коэффи- 
циентов. По уменьшенному набору признаков х можно построить 
новое уравнение регрессии, основанное на меньшем числе пере- 
менных, которое будет более компактным. 

Дальнейшим развитием методов множественной регрессии и 
корреляции является анализ канонических корреляций и вели- 
чин. Здесь весь набор исходных признаков х делят в соответст- 
вии с качественным содержанием задачи на две части, включа- 
ющие п и т—п признаков. Необходимо выявить закономерно- 
сти признаков, входящих в разные их наборы. Для каждого из 
них определяется новый признак: 


уже -- с. 4... Саха 


Уп == Спада Сакоа Сат 


Переменные й; и ў; должны быть скоррелированы между 
собой максимально тесно. Смысл переменных и может быть ис- 
толкован по значениям коэффициентов с;. Таким образом, мож- 
но считать, что у; и у1’ описывают наиболее важную закономер- 
ность коррелированности, которая проявляется в статистических 
связях признаков х1, х2, ..., Хп И Хи, Хп+2, ... Хт. Вместе с тем 
эта закономерность может оказаться не единственной, которую 
следует рассматривать. Тогда можно выделить другие новые пе- 
ременные: узи 02, узи из’ ит. д. Новые признаки у называют 
каноническими переменными, а коэффициенты корреляции между 
ними — каноническими корреляциями. 

Способ анализа корреляций большого набора признаков х 
может быть иным, когда невозможно или нежелательно разде- 
лять его на части, а следует рассматривать как единое целое. 
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Наилучшим путем анализа здесь является применение компо- 
нентного или факторного анализа. Согласно целям каждого из 
них, по корреляционной матрице признаков х находят новые ли- 
нейные переменные у, которые обычно бывают не скоррелирован- 
ными друг с другом (возможно выделение и связанных перемен- 
ных у) и описывают определепные закономерности вариации и 
коррелированности исходных признаков. Эти новые переменные 
называют в зависимости от используемого метода главными ком- 
понентами или факторами. По значениям коэффициентов с; у раз- 
ных признаков х можно интерпретировать смысл этих перемен- 
НЫХ. 

В тех случаях, когда интерпретация оказывается затрудни- 
тельной, можно трансформировать эти коэффициенты с помо- 
щью специальных приемов, что часто облегчает истолкование 
выделенных закономерностей коррелированности признаков х. 

Весьма важным является то обстоятельство, что величина 
каждой главной компоненты может быть получена у любого объ- 
екта исследования (экземпляра, особи, индивида ит. д.). При 
этом число главных компонент или факторов, суммарно описы- 
вающих весьма значительную часть информации о закономерно- 
стях вариации и коррелированности признаков, бывает гораздо 
меньшим, чем количество этих исходных переменных. Таким об- 
разом, применение компонентного или факторного анализа по- 
зволяет значительно уменьшить количество анализируемых пере- 
менных. Кроме того, главные компоненты являются комплексны- 
ми интегративными показателями, каждый из которых зависит 
от многих признаков, что также весьма ценно. 

Эти методы используют весьма широко, и им посвящена зна- 
чительная литература. Среди наиболее простых изложений мож- 
но отметить [2, 3, 4, 5, 10, 13, 14]. Существуют и более сложные, 
но и более подробные описания этих методов [11, 12, 17]. 

Методы аиализа межгрупповой измеичивости. При анализе 
межгрупповой изменчивости признаков решают обычно две зада- 
чи: дискриминации и классификации. В первом случае имеются 
две или большее число совокупностей, из которых извлечены вы- 
борки. По ним требуется получить так называемое решающее 
правило, которое позволяет на основании набора признаков х 
правильно отнести взятое наугад наблюдение (экземпляр, особь, 
индивид и т. д.) к одной из этих двух совокупностей, причем воз- 
можность ошибиться должна быть минимальной. Способы постро- 
ения таких решающих правил рассматривают дискриминантным 
анализом. При этом на основе информации о генеральных сово- 
купностях, получениой по выборкам, находят новый признак у, 
который отличается минимально возможной в данной ситуации 
трансгрессией своих распределений в двух совокупностях. Этот 
новый признак называют дискриминантной функцией. Величина 
трансгрессии, измеренная тем или иным способом, может послу- 
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жить основой для оценкн вероятности ошибки при неправильном 
отнесенин некоторого наблюдения. 

Вопросы, связанные с вычислением и примененнем дискрими- 
нантных функций, относительно доступно изложены в [2, 3, 4, 15]. 

Задача классификации наблюдений заключается в выявле- 
нни естественного, объективно существующего порядка, присут- 
ствующего в наборе выборок, которые относятся к различным ге- 
неральным совокупностям, причем их взаимоотношения априор- 
но обычно неясны. При решении подобных вопросов использу- 
ют методы кластерного анализа, которые также называют мето- 
дами распознавания образов илн числовой таксономией. 

Кластерный анализ включает в себя осуществление двух 
этапов обработки материала. Первый из них заключается в по- 
лучении представления о взанмной близости расположения цент- 
ров сравниваемых выборок по значениям комплекса признаков. 
Для этой цели используют различные методы. Так, для измери- 
тельных количественных признаков и многих качественных пока- 
зателей по любой паре анализируемых выборок может быть най- 
дено значение таксономического расстояния. Его величнна зави- 
сит от степенн сходства этих выборок по значениям признаков. 
Чем меньше оказываются различия векторов средних, тем мень- 
ше будет величина таксономического расстояния. 

Существуют различные конструкции таксономических рассто- 
яний, среди которых одной из лучших является расстояние Ма- 
халанобиса, выгодно отличающееся от других учетом внутригруп- 
повых закономерностей коррелированности признаков. Хороший 
обзор различных конструкций таксономических расстояний дан 
в [19]; об этом же можно прочесть в [4]. Для качественных приз- 
наков, имеющих альтернативную форму варьировання, могут 
быть найдены в качестве мер сходства выборок так называемые 
коэффициенты подобия. Здесь по всем признакам подсчитывают- 
ся количества совпадающих или несовпадающих вариантов, кото- 
рые затем определенным образом нормируются. 

Совокупность мер сходства между всеми парамн выборок мо- 
жет быть записана в табличном виде так называемой матрицы 
расстояний илн коэффициентов подобия. Первая из них может 
быть изображена в виде 


то Раз Раз а Рһ 7 
О. 0 Р» , ок 
Різ Р» 0 55 Рзһ 
Руһ Р, Рза а 0 


где Ру — расстояние между і-й и ј-й выборками; & — число вы- 
борок. 
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Эти таблицы являются исходными для выделения групп выбо- 
рок, включающих в себя только те из них, у которых взанмные 
расстояния относительно невелики. Напротив, сходство выборок 
из разных таких групп должно быть небольшим, а расстояния — 
значительными. Подобные группы относительно сходных выборок 
называют кластерами (образами, таксонами), а процесс их вы- 
деления — кластеризацией. 

Существуют различиые методы кластеризации. Так, согласно 
так называемым агломеративным иерархическим процедурам, 
которые наиболее часто используют в биологических исследова- 
ниях, процесс выделения кластеров осуществляется пошаговым 
образом. На первом шаге в матрице находят минимальную ве- 
личину расстояния между некоторыми единицами, которые объ- 
единяют и в дальнейшем рассматривают как кластер. После на- 
хождения расстояний этого кластера с остальными единицами 
отыскивают новую минимальную величину Ду, так что образу- 
ется новый кластер. Такой процесс последовательного укрупне- 
ния таксонов продолжают до получения некоторой их структу- 
ры. Методы кластерного анализа описаны в [3, 4, 7]. 

Существует также метод многомерного анализа межвыбо- 
рочной изменчивости, который позволяет одновременно решать 
как задачи дискриминантного анализа, так и проблемы класси- 
фикации. Этот метод называют каноническим анализом (множе- 
ственным дискриминантным анализом). В соответствии с ним рас- 
сматривают межгрупповые и внутригрупповые корреляционные 
матрицы и дисперсии. В результате находят новые линейные 
признаки так, чтобы каждый из них разделял анализируемые вы- 
борки с достижением мннимальной трансгрессии, т. е. был дис- 
криминантной функцией. Любая нз них может считаться описы- 
вающей некоторую закономерность межгрупповой вариации, 
конкретный смысл которой истолковывают при рассмотрении 
коэффициентов с; у разных признаков х. Наиболее важные из 
этих дискриминантных функций при попарном рассмотрении по- 
зволяют получить плоскости, расположение на которых центров 
выборок наглядно представляет их взаимоотношения. По этим 
графикам возможно выделение кластеров. О каноническом ана- 
лизе читатель может прочесть в [1, 4, 20]. 

Использование вычислительной техники при проведении био- 
метрических расчетов. В данном учебном пособии приведены 
главным образом алгоритмы, ориентированные преимуществен- 
но на ручные вычисления при помощи простейших электронных 
калькуляторов. Вместе с тем к настоящему времени существуют 
вполне доступные программируемые калькуляторы отечественно- 
го производства Б3-34, МК-54, МК-56, МК-61, МК-52, к которым 
разработаны и опубликованы [6, 8, 16] значительные библиотеки 
программ; среди них программы автоматического проведения 
биометрических расчетов. Несмотря на невысокое быстродейст- 
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вие этих калькуляторов, их применение позволяет в несколько 
раз ускорить проведение биометрических вычислений, а также 
исключить многие возможные ошибки. 

Гораздо ббльшие возможности открывает использование ЭВМ, 
особенно персональных. С принципами их работы и применения 
читатель может познакомиться по соответствующей литературе 
[9, 18]. Следует лишь помнить о том, что при написании про- 
грамм вычисления биометрических характеристик необходимо 
ориентироваться на применение формул и алгоритмов, в кото- 
рых фигурируют суммы анализируемых показателей: Ух, Хх?, 
223, Ўх*, Ухо и т. д. Получение этих величин весьма просто 
программируется; на их основе могут быть определены средние 
величины, коэффициенты асимметрии, эксцесса, корреляции 
и т. д. Программирование обработки вариационных рядов целе- 
сообразно главным образом для получения кривых распределе- 
ния, сглаживающих эмпирическую картину. 

При вводе данных в ЭВМ полезно предусмотреть програм- 
мное выявление в иих ошибок ввода. Для этой цели можно ис- 
пользовать, например, простейшую проверку для каждого на- 
блюдения выполнения неравенства хит Х<Хшах. Предельные 
значения могут быть найдены предварительно и введены в ЭВМ 
до начала ввода всего массива данных. 

Основной трудностью обработки биометрических массовых 
данных на ЭВМ является их точный ввод, исключающий весьма 
вероятные ошибки. Поэтому целесообразнее оказывается обра- 
ботка не отдельных признаков, которая позволяет получить лишь 
небольшой набор характеристик (среднюю, дисперсию, их ошиб- 
ки, коэффициенты асимметрии и эксцесса), а одновременный 
обсчет сразу всех исследуемых признаков. Это позволяет вычис- 
лять кроме перечисленных одномерных показателей для каждой 
переменной также и значения коэффициентов корреляции для 
всех попарных сочетаний признаков, параметров уравнений рег- 
рессии. Для этого следует последовательно вводить в ЭВМ не 
отдельные значения одного признака у разных единиц наблюде- 
ния, а целые наборы признаков для каждой такой единицы. 


ПРИЛОЖЕНИЯ (МАТЕМАТИЧЕСКИЕ ТАБЛИЦЫ) 


Таблица І. Значения интеграла вероятностей для разных значений ї 
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| 9836 
2, 9876 
2, 9907 
2, 9931 
2, 9949 
2,9 9963 
3,0 9973 
3,1 9981 
3,2 9986 
3,3 9990 
3,4 9993 
3,5 9995 

Примечание. 


Сотые доли $ 


Значения вероятности даиы числами после запятой. 
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и 
Таблица П. Значения функции [(Ё) = Уа" 2 
2л 
(ординаты нормальной кривой) 
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а 
Таблица ПІ. Значения вероятности ра (т) == е8 
т 


3679 
3679 
1839 
0613 
0153 
0031 
0005 
0001 


6065 | 5488 | 4966 | 4493 
3033 | 3293 | 3476 | 3595 
0758 | 0988 | 1217 | 1438 
0126 | 0198 | 0284 | 0383 
0016 | 0030 | 0050 | 0077 
0002 | 0004 | 0007 | 0012 


6703 
2681 
0536 
0072 
0007 
0001 


һо с > с м © 
о 
© 
о 
о 


11 2,0 


3347 2707 
2510 2707 
1255 1804 
0471 0902 
0141 0361 
0035 0120 
0008 0034 
0001 0009 
0002 


Фо уос с м о 
о 
[а>] 
р 
< 
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1225 | 1108 | 1003 | 0903 | 0821 | 0743 | 0672 | 0608 | 0550 | 0498 
2572 | 2438 | 2306 | 2177 | 2052 | 1931 | 1815 | 1703 | 1596 | 1494 
2700 | 2681 | 2652 | 2613 | 2565 | 2510 | 2450 | 2384 | 2314 | 2240 
1890 | 1964 | 2083 | 2090 | 2138 | 2176 | 2205 | 2225 | 2234 | 2240 
0992 | 1087 | 1169 | 1254 | 1336 | 1414 | 1488 | 1557 | 1622 | 1680 
0602 | 0668 | 0735 | 0804 | 0872 | 0941 | 1008 
0146 | 0175 | 0206 | 0241 | 0278 | 0319 | 0362 | 0407 | 0456 | 0504 
0044 | 0055 | 0068 | 0083 | 0099 | 0118 | 0140 | 0163 | 0188 | 0216 
0012 | 0015 | 0020 | 0025 | 0031 | 0039 | 0047 | 0057 | 0068 | 0081 
0003 | 0004 | 0005 | 0007 | 0009 | 0011 | 0014 | 0018 | 0022 | 0027 
0001 | 0001 | 0001 | 0002 | 0002 | 0003 | 0004 | 0005 | 0006 | 0008 
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Продолжение табл. П 


3,5 4,0 4,5 5,0 6,0 7,0 8,0 9,0 10,0 | 11,0 
т 
0 0302 | 0183 | 0111 | 0067 | 0025 | 0009 | 0003 | 0001 | 0000 | 0000 
1 1057 | 0733 | 0500 | 0337 | 0149 | 0064 | 0027 | 0011 | 0005 | 0002 
2 1850 | 1465 | 1125 | 0842 | 0446 | 0223 | 0107 | 0050 | 0023 | 0010 
3 2153 | 1954 | 1687 | 1404 | 0892 | 0521 | 0286 | 0150 | 0076 | 0037 
4 1888 | 1954 | 1898 | 1755 | 1339 | 0912 | 0573 | 0337 | 0189 | 0102 
5 1327 | 1563 | 1708 | 1755 | 1606 | 1277 | 0916 | 0607 | 0378 | 0224 
6 0771 | 1042 | 1281 | 1462 | 1606 | 1490 | 1221 | 0911 | 0631 1 0411 
7 0386 | 0595 | 0824 | 1044 | 1377 | 1490 | 1396 | 1171 1 0901 | 0646 
8 0169 | 0298 | 0463 | 0653 | 1033 | 1304 | 1396 | 1318 | 1126 | 0888 
9 0066 | 0132 | 0232 | 0363 | 0688 | 1014 | 1241 | 1318 | 1251 | 1085 
10 0023 | 0053 | 0104 | 0181 | 0413 | 0710 | 0993 | 1186 | 1251 | 1294 
П 0007 | 0019 | 0043 | 0082 | 0225 | 0452 | 0722 | 0970 | 1137 | 1194 
12 0002 | 0006 | 0016 | 0034 | 0113 | 0264 | 0481 | 0728 | 0948 | 1094 
13 0001 | 0002 | 0006 | 0013 | 0052 1 0142 | 0296 | 0504 | 0729 | 0926 
14 0000 | 0001 | 0002 | 0005 | 0022 | 0071 | 0169 | 0324 | 0521 | 0728 
Примечание. Значения вероятиости даиы числами после запятой. 
Таблица ТУ. Случайные числа 
3393 6270 4228 6069 9407 1865 8549 3217 2351 8410 
9108 2330 2157 7416 0398 6173 1703 8132 9065 6717 
7891 3590 2502 5945 3402 0491 4328 2365 6175 7695 
9085 6307 6910 9174 1753 1797 9299 3422 9861 8357 
2638 2908 6368 0398 5495 3283 0031 5955 6544 3883 
1313 8338 0623 8600 4950 5414 7131 0134 7241 0651 
3897 4202 3814 3505 1599 1649 2784 1994 5775 1406 
4380 9543 1640 2850 8415 9120 8062 2421 6161 4634 
1618 6309 7909 0874 0401 4301 4517 9197 3350 0434 
4858 4676 7363 9141 6133 0549 1972 3461 7116 1496 
5354 9142 0847 5393 5416 6505 7156 5634 9703 6221 
0905 6986 9396 3975 9255 0537 2479 4589 0562 5345 
1420 0470 8679 2328 3939 1292 0406 5428 3789 2882 
3218 9080 6604 1813 8209 7039 2086 3369 4437 3798 
9697 8431 4387 0622 6893 8788 2320 9358 5904 9539 
0912 4964 0502 9683 4636 2861 2876 1273 7870 2030 
4636 7072 4868 0601 3894 7189 8417 2367 7032 1003 
2515 4734 9878 6761 5686 2949 3979 8650 3430 0635 
5964 0412 5019 2369 6461 0678 3693 2928 3740 8047 
7848 1523 7904 1521 1455 7089 8094 9872 0898 7174 
5192 2571 3643 0707 3434 6818 5729 8615 4298 4129 
8438 8395 9886 1805 0226 2310 3675 5058 2515 2388 
8106 6349 0319 5436 6838 2460 6433 0644 7428 8556 
9158 8263 6504 2562 1160 1526 1816 9690 1215 9590 
6061 3525 4048 0382 4224 7148 8259 6526 5340 4064 
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“аблица У. Критические точки і-критерия Стьюдента при различных уровнях 
значимости а 


Число 2% Число 9, % 
степеней степеней 
СВО 5 | 1 | 01 сзоболы 5 | 1 | 01 
1 12.71 63,66 64,60 18 2,10 2,88 3,92 
2 4,30 9,92 31,60 19 2,09 2,86 3,88 
3 3,18 5,84 12,92 20 2,09 2,85 3,85 
4 2,78 4,60 8,61 21 2,08 2,83 3,82 
5 2,57 4,03 6,87 22 2,07 2,82 3,79 
6 2,45 3,71 5,96 23 2,07 2,81 3,77 
7 2,37 3,50 5,41 24 2,06 2,80 3,75 
8 2,31 3,36 5,04 25 2,06 2,79 3,73 
9 2,26 3,25 4,78 26 2,06 2,78 3,71 
10 2,23 3,17 4,59 27 2,05 2,77 3,69 
11 2,20 3,11 4,44 28 2,05 2,76 3,67 
12 2,18 3,05 4,32 29 2,05 2,76 3,66 
13 2,16 3,01 4,22 30 2,04 2,75 3,65 
14 2,14 2,98 4,14 40 2,02 2,70 3,55 
15 2,13 2,95 4,07 60 2,00 2,66 3,46 
16 2,12 2,92 4,02 120 1,98 2,62 3,37 
17 2,11 2,90 3,97 оо 1,96 2,58 3,29 
0,05 | 0,01 | 0,001 | — | 0,05 | 0,01 | 0,001 


1* 


4 


№ 


— 


чом ьо ы 


1% (нижняя строка) 


Е, — степени свободы для большей дисперсии 


161 | 200 | 216 
4052 | 4999 | 5403 
18,51 | 19,00 | 19,16 
98,50 | 99,00 | 99/17 
10,13 | 9,55 | 9,28 
34,12 | 30,82 | 29,16 

771 | 694 | 659 
21,20 | 18,00 | 16,89 

6,61 | 579 | 5,41 
16,26 | 13,97 | 12,06 

5,99 | 514 | 476 
13,75 | 10,92 | 9,78 

5,59 | 474 | 435 
12,25 | 9,55 | 847 

532 | 446 | 407 
11,26 | 8,65 | 759 


“аблица УТ. Значения Е-критерия Фишера при уровнях значимости 0=5% 
(верхняя строка) и а= 


Продолжение табл. У 


№, — степеви свободы для большей дисперсии 


` | 
1 2 3 4 5 6 7 8 
5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 
10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 
10 Е. 4,10 3,71 3,48 3,33 3,22 3,14 3,07 
10; 7,56 6,55 5,99 5,64 5,39 5,20 5,06 
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 
9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 
19 4,75 3,80 3,49 3,26 3,11 3,00 2,91 2,85 
9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 
13 4,67 3,80 3,41 3,18 3,02 2,92 2,83 2,77 
9,07 6,70 5,74 5,21 4,86 4,62 4,44 4, 130 
Продолженив табл. У 
Е — степени свободы для большей дисперсии 
ИК | 
9 10 12 15 20 30 оо 
1 241 242 244 246 | 248 250 254 
6022 6056 6106 6157 6209 6261 6366 
р. 19,38 19,40 19,41 19,43 19,45 19,46 19,50 
99,39 99,40 99,42 99,43 99,45 99,47 99,50 
3 8,81 8,79 8,74 8,70 8,66 8,62 8,53 
27,35 27,23 27,05 26,87 26,69 26,50 26,13 
4 5,94 5,94 5,91 5,86 5,80 5,75 5,63 
14,66 14,55 14,37 14,20 14,02 13,84 13,46 
5 4,77 4,74 4,68 4,62 4,56 4,50 4,36 
10,16 10,05 9,89 9,72 9,55 9,38 9,02 
6 4,10 4,06 4,00 3,94 3,87 3,81 3,67 
17,98 7,87 7,72 7,56 7,40 7,23 6,88 
7 3,68 3,64 3,57 3,51 3,44 3,38 3,23 
6,72 6,62 6,47 6,31 6,16 5,99 5,65 
8 3,39 3,35 3,28 3,22 3,15 3,08 2,93 
5,91 5,81 5,67 5,52 5,36 5,20 4,86 
9 3,18 3,14 3,07 3,01 2,94 2,86 2,71 
5,35 5,26 5,11 4,96 4,81 4,65 4,31 
10 3,02 2,98 2,91 2,85 2,77 2,70 2,54 
4,94 4,85 4,71 4,56 4,41 4,25 3,91 
И 2,90 2,85 2,79 2,72 2,65 2,57 2,40 
4,63 4,54 4,40 4,25 4,10 3,94 3, ‚60 
12 2,80 2,75 2,69 2,62 2,54 2,47 2, '30 
4,39 4,30 4,16 4,01 3,86 3,70 3,36 
13 2,71 2,67 2,60 2,53 2,46 2,38 2,21 


4,19 4,10 3,96 3,82 3,66 3,51 3,16 
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Бу — степени свободы для большей дисперсии 


Продолжение табл. ҮІ 


3 4 5 6 7 8 

14 460 | 3,74 | 334 | 311 | 296 | 2,85 | 276 | 270 
886 | 6,51 | 556 | 5,04 | 4,69 | 4,46 28 | 4,14 
15 454 | 3,68 | 3,29 | 3,06 | 290 | 2,79 | 271 | 264 
8,68 | 636 | 542 | 4,89 | 456 | 4,32 | 4,14 | 400 
16 4,49 | 3,63 | 3,24 | 3,01 | 2,85 | 2,74 | 2,66 | 2,59 
8,53 | 6,23 | 529 | 477 | 4,44 | 4,20 | 4,03 | 389 
17 445 | 3,59 | 3,20 | 296 | 281 | 2,70 | 2,61 | обб 
840 | 61 | 518 | 4,67 | 434 | 393 | 379 | 268 
18 4,41 | 355 | 316 | 293 | 277 | 2,66 | 258 | ов 
8,29 6,01 5,09 ‚58 4,25 4,01 ‚84 371 

19 4,38 | 3,52 313 | 2,90 | 2,74 | 2,63 | 2,54 
818 | 593 | 501 | 450 | 417 | 394 | 377 | 248 

20 4,35 | 3,49 3,10 2,87 2,71 2,60 2,51 
в10 | 585 | 494 | 443 | 410 | 887 | зло | 225 

21 4,39 | 3,47 | 3,07 | 2,84 | 2,68 | 2,57 | 249 
805 | 578 | 487 | 437 | 404 | зві | 384 | 222 

99 4,30 3,44 3,05 2,82 2,66 2,55 2,46 
795 | 572 | 482 | 431 | 399 | 376 | 359 | 240 

23 428 | 3,42 | 3,03 | 2,80 | 2,64 | 253 | 2,44 
788 | 5,66 | 476 | 426 | 394 | 3,71 | 3,54 и 

2 3,40 | 301 | 2,78 | 2,62 | 2,51 | 2,42 
7 ты 5,61 | 472 | 4,22 | 3,90 | 3,67 | 3,50 296 
25 424 | 339 | 2,99 | 2,76 | 2,60 | 249 | 240 | әз 
7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 
422 | 3,37 | 2,98 | 274 | 259 | 247 | 2,39 | озо 
25 772 | 553 | 464 | 414 | 3,82 | 359 | 342 | 329 
421 | 3,35 | 2,96 | 2738 | 257 | 246 | 237 | озі 
я 768 | 5,49 | 460 | %11 | 378 | 356 | 3,39 | 3,26 
420 | 3,34 | 2,95 | 271 | 256 | 2,45 | 2,36 | 229 
ыы 764 | 5,45 | 457 | 407 | 3,75 | 3,53 | 3,36 | 3,23 


Продолжение табл. У 


Е, — степени свободы для большей дисперсии 


ь | | 
9 10 12 15 20 30 оо 
14 9,65 2,60 2,53 2,46 2,39 2,31 2,13 
4,03 3,94 3,80 3,66 3,51 3,35 3,00 
15 2,59 2,54 2,48 2,40 2,33 2,25 2,07 
3,89 3,80 3,67 3,52 3,37 3,21 2,87 
16 2,54 2,49 2,42 2,35 2,28 2,19 2,01 
3,78 3,69 3,55 3,41 3,26 3,10 2,75 
17 2,49 2,45 2,38 2,31 2,23 2,15 1,96 
3,68 3,59 3,46 3,31 3,16 3,00 9,65 
18 2,42 2,38 2,31 2,23 2,16 2,07 1,88 
3,60 3,51 3,37 3,23 3,08 2,92 2,57 
19 2,42 2,38 2,31 2,93 2,16 2,07 1,88 
3,52 3,43 3,30 3,15 3,00 2,84 2,49 
20 2,39 2,35 2,28 2,20 2,12 2,04 1,84 
3,46 3,37 3,23 3,09 2,94 2,78 2,42 
21 2,37 9,32 2,25 2,18 2,10 2,01 1,81 
3,40 3,31 3,17 3,03 2,88 2,72 2,36 
22 2,34 2,30 2,23 2,15 2,07 1,98 1,78 
3,35 3,26 3,12 2.98 2,83 2,67 2,31 
23 2,32 2,27 2,20 2,13 2,05 1,96 1,76 
3,30 3,21 3,07 2,93 2,78 2,62 2,26 
24 2,30 2,25 2,18 2,11 2,03 1,94 1,73 
3,26 3,17 3,03 2,89 9,74 2,58 2.21 
25 2,28 2,24 2,16 2,09 2,01 1,92 1,71 
3,22 3,13 2,99 2,85 2,70 2,54 2,17 
26 2,27 2,22 2,15 2,07 1,99 1,90 1,69 
3,18 3,09 2,96 2,81 2,66 2,50 2,13 
27 2,25 2,20 2,13 2,06 1,97 1,88 1,67 
3,15 3,06 2,93 2,78 2,63 2,47 2,10 
28 2,24 2,19 2,12 2,04 1,96 1,87 1,65 
3,12 3,03 2,90 2,75 2,60 2,44 2,06 
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Продолжение табл. УТ 


у — степени свободы для большей дисперсин 


1 | 2 | 3 | 4 


4,18 3,33 2,93 2,70 
7,60 5,42 4,54 4,04 
4,17 3,32 2,92 2,69 
7,56 5,39 4, 51 4,02 
4,15 3,29 2,90 2,67 
7,50 5,34 4,46 3,97 
4,13 3,28 2,88 2,65 
7,44 5,29 4,42 3,93 
4,11 3,26 2,87 2,63 
7,40 5,25 4,38 3,89 
4,10 3,24 2,85 2,62 
7,35 5,21 4,34 3,86 
4,08 3,23 2,84 2,61 
7,31 5,18 4,31 3,85 
4,07 3,22 2,83 2,59 
7,28 5,15 4,29 3,80 
4,06 3,21 2,82 2,58 
7,25 5,12 4,26 3,78 


5 


Суу хм чм чм 


Фоо юм 


сә № Сәм сәм сМ 
шо ет 


6 | 7 


2,43 | 2,35 
3,50 | 3,33 
242 | 2,33 
3,47 | 3,30 
2,40 | 231 
3,43 | 3,25 
238 | 229 
3,39 | 3,29 
2,36 | 228 
3,35 | 318 
235 | 296 
3,32 | 315 
2,34 | 255 
3,29 | 312 
232 | 224 
3,27 | 310 
231 | 2,23 
3,24 | 3,08 
2,30 | 2,29 
3,22 | 3,06 
2,30 | 221 
3,20 | 3,04 
2,29 | 2,20 
3,19 | 3,02 
2,25 | 217 
319 | 295 
223 | 914 
3,07 | 291 
221 | 213 
3,04 | 2,87 
219 | 210 
299 | 282 
2,16 | 2,07 
2,92 | 9,76 
2,14 | 2,06 
289 | 273 
210 | 2,01 
280 | 2,64 


һә әһә 


Со Сәм (ом сә 
с № к 


оо оц эм со 


Продолжение табл. У. 


К — степенн свободы для большей дисперсии 


14 30 


10 | 11 


1,94 | 1,83 | 1,64 


222 | 218 | 214 |210 | 2,05 | 
69 |257 |241 |203 
9 


29 2 
309 | 3.00 | 293 |287 | 277 |2 

1 

2 


30 2,21 | 2,16 | 2,13 | 2,09 | 2,04 1,93 1,84 1,62 
3,00 | 2,17 | 2,90 | 2,84 | 2,74 ‚66 2,55 2,38 | 2,01 


2,19 2,14 | 2,10 | 207 | 2,01 1,97 1,91 1,82 1,39 
3,02 | 2,93 | 286 | 280 | 2,70 | 2,62 2,50 2,34 1,96 


34 |217 | 2,12 | 2,08 | 2,05 | 1,99 | 1,95 1,89 1,80 1,57 
298 | 2,89 | 2,28 | 276 | 2,66 | 2,58 2,46 | 2,30 1,91 


2,15 | 2,11 | 2,07 | 2,03 | 1,98 1,93 1,87 1,78 1,55 
2,95 | 2,86 | 2,76 | 2,72 | 2,62 | 2,54 2,43 2,26 1,87 


38 |214 | 2,09 | 205 | 202 | 1,96 | 1,92 | 1,85 | 1,76 | 1,53 
2,95 | 2,82 | 2,75 | 269 | 259 | 251 | 240 | 2,93 | 1584 


40 |212 | 2,08 | 2,04 | 2,00 | 1,95 | 1,90 |184 |174 |151 
289 | 280 | 273 | 266 | 2,56 | 248 | 237 |220 | 180 
а | 211 | 2,06 | 2,03 | 1,99 | 1,93 | 1,89 | 1,83 | 1,73 | 1,49 
286 | 278 | 270 | 2,64 | 2,54 | 246 | 234 | 218 |178 
44 |210 | 2,05 | 2,01 | 198 | 1,92 | 1,88 | 181 | 172 |148. 
284 | 2,75 | 268 | 262 ! 2,52 |244 |232 |915 |175 
46 | 2,09 | 2,04 | 2,00 | 1,97 | 191 | 1,87 |180 | 1,71 | 1,46 
2:892 | 2,73 | 266 |260 | 2,50 | 242 | 930 | 213, | 173 
48 12,08 | 2,03 | 1,99 | 196 | 1,90 | 1,86 |179 |170 | 145 
280 |272 | 264 | 258 | 248 | 240 | 298 |212 |170 
50 | 2,07 | 2,03 | 1,99 | 195 | 1,89 | 1,85 | 178 | 1,69 | 1,44 
279 |270 |263 |256 | 246 | 238 | 296 |210 | 168 
во | 2,04 | 1,99 | 1,95 | 192 | 1,86 | 1,82 |175 | 1,65 | 1,39 
272 | 2,63 | 2,56 |250 | 239 |231 |220 | 2,03 | 1,60 
то | 2,02 | 1,97 | 193 | 1,89 | 1,84 | 179 | 172 |1,62 | 1,35 
267 | 2,59 |251 |245 | 235 | 227 | 915 | 198 | 153 
80 | 2,00 | 1,95 | 191 | 1,88 | 1,82 | 1,77 | 1,70 | 1,60 | 1,32 
264 | 2,55 | 248 | 249 | 231 | 223 | 9219 | 194 |149 
100 | 1,97 | 1,93 | 1,89 | 1,85 [1,79 | 1,75 | 168 | 1,57 | 1,28 
259 | 2,50 | 243 | 237 | 9,96 |219 | 206 | 1,89 | 143 
150 | 1,94 | 1,89 | 1,85 | 1,82 | 176 | 171 | 1,64 |158 |1,22 
253 | 9,44 | 237 | 231 | 220 |212 | 900 |1,83 |133 
200 | 1,93 | 1,88 | 1,84 |180 | 1,74 | 1,69 |162 | 1,52 | 119 
2:50 | 2,41 | 2:34 | 297 |217 | 209 | 197 | 179 | 198 
со | 1,88 | 1,83 | 179 (1,76 | 1,69 |164 |157 |146 | 1,00 
241 | 232 |225 | 218 | 2,08 |200 |188 |170 | 1.00 
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зблица УП. х?-Распределение. Критические (процентные) точки для разных 


Ф ооч © сл > со № ~ 


значений вероятности Р и чисел степеней свободы № 


а, % 


[ежу 


| 


0,01 
0,07 


> Оооо © © © оъ ны > бл бот 


М-Ф Ф оо оомо с сл сл 
© — о &> Ооо сло о спо > Б „= 


Р, % 


0,02 
0,12 
0,30 
0,55 
0,87 
1,24 
1,65 
2,09 
2,56 
3,05 
3,57 
4,11 
4,66 
5,23 
5,81 
6,41 
7,02 
7,63 
8,27 
8,90 
9,54 
10,20 
10,86 
11,52 
12,20 
12,88 
13,56 
14,25 
14,95 
15,66 
16,36 
17,07 
17,79 
18,51 
19,23 
19,96 
20,69 
21,43 
22,16 
22,91 
23,65 
24,40 
25,15 
25,90 
26,66 
27,42 
28.18 
28,94 
29,71 
30,48 


0,05 
0:92 
0,48 
0,83 
1,24 
1,69 
2,18 
270 
3,25 
3,82 
4,40 
5,01 
5,63 
6,96 
6,91 
7,56 
8,93 
8,91 
9,59 
10,28 
10,98 
11,69 
19,40 
13,19 
13,84 
14,57 
15,31 
16,05 
16,79 
17.54 
18,29 
19,05 
19,81 
20,57 
21,34 
22,11 
22,88 
23,65 
24.43 
25,22 
26,00 
26,78 
27,58 
28,37 
29,16 
29,96 
30,76 
31,56 
32,36 
53,16 


99,9 | 99,5 | 99,0 | 97,5 | 95,0 


0,10 
0,35 
0,71 
1,14 
1,64 
2,17 
2,73 
3,32 
3,94 
4,58 
5,23 
5,89 
6,57 
7,26 
7,96 
8,67 
9,39 
10,12 
10,85 
11,59 
12,34 
13,09 
13,85 
14,61 
15,38 
16,15 
16,93 
17,71 
18,49 
19,28 
20,07 
20,88 
21,66 
22,46 
28,27 
24,08 
24,88 
25,70 
26,51 
27,33 
28,14 
28,97 
29,79 
30,61 
31,44 
32,27 
33,10 
33,93 
34,76 
35,60 
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Продолжение табл. УГ 


а, % | Р, % 
5 5 | 25 | 1 | 05 | 01 | 99,9 | 995 | 99,0 | 97,5 | 950. 


59 69,83] 73,811 78,62 82,00 89,27| 26,061 29,48) 31,25] 33,97! 36,44 
53 70,99 | 75,00| 79,84] 83,25! 90,57] 26,76! 30,23] 32,02! 34,781 37,28 
54 72,15| 76,19) 81,07! 84,50 91,87| 27,47 30,981 32,79 | 35,59| 38,12 
55 73,31! 77,38| 82,29] 85,78| 93,17| 28,17| 31,741] 33,57| 36,401 38,96 
56 74,47| 78,57| 83,51| 86,99| 94,46! 28,88| 32,49] 34,35| 37,21| 39,80 
57 75,62| 79,75! 84,73| 88,94 95,75] 29,59| 33,25| 35,13! 38,03| 40,65 
58 76,78| 80,94| 85,95| 89,48| 97,04 30,30 | 34,01| 35,911 38,84! 41,49 
59 77,931 82,12| 87,17| 90,72| 98,32] 31,02| 34,77| 36,70| 39,66| 42,34 
60 79,08| 83,30! 88,38] 91,95| 99,61| 31,74| 35,54] 37,48| 40,48| 4319 
61 80,23| 84,48| 89,59| 93,191100,89 | 32,46| 36,30| 38,27| 41,30] 44,04 
62 81,38| 85,65| 90,80} 94,42|102,17| 33,18| 37,07| 39,06] 42,13! 44,89 
63 82,53| 86,83! 92,01! 95,65 |103,44| 33,91| 37,84| 39,86] 42,95| 4574 
64 83,68| 88,00| 93,22| 96,88 |104,72|| 34,63! 38,61| 40,65! 43,78| 46,60 
65 84,891 89,18| 94,42| 98,111105,99] 35,361 39,38] 41,44) 44,60| 47,45 
66 85,97| 90,35] 95,63| 99,331107,26| 36,09| 40,16] 42,24] 45,43| 48,30 
67 87,11| 91,59] 96,831 100,6 |108,53|| 36,831 40,94| 43,04| 46,96| 49,16 
68 88,25 92,6<| 98,031101,8 |109,79| 37,56] 41,71| 43,84] 47,09| 50,02 
69 89,39! 93,85] 99,23] 103,0 |111,06| 38,30] 42,49| 44,64| 47,92] 50,88 
70 90,53| 95,021 100,4 |104,2 12,32| 39,04! 43,28| 45,44| 48,76| 5174 
71 91,67} 96,19] 101,6 |105,4 |{13,58| 39,78| 44,06] 46,25| 49,59 52,60 
72 92,81| 97,35] 102,8 |106,6 |114,84| 40,52| 44,84| 47,05| 50,43! 53,46 
73 93,94! 98,521 104,0 |107,8 |116,09| 41,261 45,63| 47,86 51,26! 54,32 
74 95,08! 99,681 105,2 |109,1 |117,35| 42,01| 46,42| 48,671 52,10| 55,19 
75 96,22 |100,8 |106,4 |110,3 |{18,601 42,76| 47,21| 49,48! 52,94| 56.05 
76 97,35 | 102,001 107,58 |111,501119,85| 43,51| 48,00| 50,29| 53,78| 56,92 
77 98,48 1103,16] 108,77 ЕО 121,10] 44,26| 48,79| 51,10| 54,69 57,79 
1 


78 99,62 |104,32| 109,961 113,91 [122,35 45,01| 49,58| 51,91| 55,47| 58,65 
79 100,75 |105,47 |111,14|115,121123,59|| 45,76, 50,38| 52,72| 56,31| 59,52 
80 101,88 1106,63 | 112,33 | 116,32 |124,84| 46,52| 51,17| 53,54 57,15! 60,39 
81 103,011107,78| 113,51 | 117,52 1126,08 47,28 51,97| 54,36| 58,00| 61,26 
82 104,14 | 108,941 114,70 | 118,73 |127,32| 48,04| 52,77| 55,17| 58,841 62,13 
83 105,27 1110,091115,88 |119,93 1128,56] 48,80| 53,57| 55,99 | 59,69| 63,00 
84 106,401111,24| 117,06]121,13 |129,80|| 49,561 54,37| 56,81| 60,54 | 63,88 
85 107,52] 112,39 | 118,24 |122,32 1131,04|| 50,32| 55,17} 57,63] 61,39| 64,75 
86 108,65 113,54 | 119,41 1123,52 |132,28| 51,08 55,97| 58,46] 62,24| 65,62 
87 109,77 1114,69 120,59 1124,72 |133,51| 51,85| 56,78] 59,28 63,09] 66,50 
88 110,90|115,84| 121,77 | 125,91 |134,74| 52,62] 57,58| 60,10] 63,94| 67,37 
89 112,021117,001 122,94 | 127,11 |135,98| 53,39| 58,39| 60,93] 64,79| 68,25 
90 113,141 118,141124,12 | 128,301137,21 54,161 59,20| 61,75 | 65,65! 69,13 
91 114,27 1119,28 | 125,291 129,49 1138,44 54,931 60,00| 62,58] 66,50] 70,00 
92 115,391120,43] 126,46 130,68 139,67 55,70| 60,82| 63,41| 67,36| 70,88 
93 116,51 1121,57 | 127,631 131,87 140,89 56,471 61,62] 64,24! 68,21] 71,76 
94 117,631 122,721 128,80] 133,06\ 142,12 57,25| 62,44| 65,07! 69,07| 72,64 
95 118,75] 123,86] 129,97 | 134,25 143,34 58,02| 63,25| 65,901 69,92| 73,52 
96 119,87 |125,00| 131,14 |135,43]144,57 | 58,80| 64,06! 66,73| 70,78, 74,40 
97 120,99|126,14| 132,31 [136,62 |145,79| 59,58! 64,88! 67,56] 71,64| 75,28 
98 122,11 [127,29|133,48 |137,80 147,01] 60,36| 65,69 68,40] 72,50] 76,16 
99 123,22 |128,42 | 134,64 | 138,99 [148,231 61,14| 66,51| 69,23 73,36| 77,05 
100 124,34 |129,561135,81 1140,17 |149,45| 61,92| 67,33 70,06| 74,22| 77,93 


Р | 5 сов у сло бак оао ов ово сет 0,950 
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Таблица УПІ. Значения ф==2 агсзтУ Р 


р | 0 | 1 | 2 | Е 
0,0 0,000 |0,020 | 0,028 1 0,035 
0,1 0,063 | 0,066 | 0,069 | 0,072 
0,2 0,089 | 0,092 | 0,094 | 0,096 
0,3 0,110 | 0,111 10,113 | 0,115 
0,4 0,127 [0,128 10,130 | 0,131 
0,5 0,142 10,143 10,144 | 0,146 
0,6 0,155 | 0,156 | 0,158 | 0,159 
0,7 0,168 | 0,169 | 0,170 | 0,171 
0,8 0,179 10,180 | 0,182 |0, '183 
0,9 0,190 [0,191 10,192 | 0,193 
1 0,200 | 0,210 10,220 | 0,229 
РА 0,284 | 0,291 10,298 [0,304 
3 0,348 | 0,354 | 0,360 | 0,363 
4 0,403 | 0,408 | 0,413 | 0,418 
5 0,451 | 0,456 | 0,460 | 0,465 
6 0,495 | 0,499 | 0,503 | 0,507 
7 0,535 10,539 | 0,543 | 0,546 
8 0,574 | 0,577 |0,581 | 0,584 
9 0,609 10,613 |0,616 | 0,620 
10 0,644 | 0,647 | 0,650 | 0,653 
11 0,676 | 0,679 | 0,682 |9,686 
12 0,707 | 0,711 10,714 0717 
13 0,738 | 0,741 | 0,744 | 0,747 
14 0,767 | 0,770 | 0,773 0,776 
15 0,795 | 0,798 | 0,801 | 0,804 
16 0,823 |0,826 | 0,828 | 0,831 
17 0,850 | 0,853 | 0,855 | 0,858 
18 0,876 | 0,879 | 0,881 | 0,884 
19 0:902 0,905 10,907 | 0,910 
20 0,927 10,930 | 0,932 | 0,935 
21 0, 952 0,955 | 0,957 | 0,959 
20 0,976 10,979 | 0,981 | 0,984 
23 1 '000 1,003 | 1,005 | 1,007 
24 1,024 | 1,026 | 1,029 |1,031 
25 1,047 | 1,050 | 1,052 |1,054 
26 1,070 | 1,072 | 1,075 | 1,077 
27 1,093 | 1,095 | 1,097 | 1,100 
28 1, "115 1,117 [7,120 [1,129 
29 1,137 [1,140 | 1,142 [1,144 
30 1.159 1,161 [1,164 {1,166 
31 1,182 | 1,183 | 1,185 | 1,187 
32 1,203 11,205 | 1,207 |1,209 
33 1,224 | 1,226 | 1,298 | 1,230 
34 1,245 | 1,247 | 1,249 | 1,251 
35 1,266 | 1,268 | 1,270 | 1,272 
36 1,287 | 1,289 | 1,291 | 1,293 
37 1 !308 1,310 | 1,312 | 1,314 
38 1, '328 1,330 | 1,333 | 1,335 
39 1,349 | 1,351 |1,353 | 1,355 
40 1.369 1,371 | 1,374 11,376 


к | 


ИЕ 


Продолжение табл. УП 


Продолжение табл. УШ 


0,00 оо |—3,09| —2,88| —2,75| —2,65 |—2,58 | —2,51 | —2,46| —2,41 |—2,37 
0,01 —9,53|—2,29 | —2,26] —2,23 | —2,20 | 2,17 | —2,14|—2,12 | —2,10, —2,07 
0,02 |-2,05|—2,03|—2,01 | —2,001—1,98 | —1,96 | —1,94|—1,93| —1,91 | —1,90 
0,03 |—1,88|—1,87| —1,85] —1,84|—1,83 | —1,81 | —1,80| —1,791 —1,77 |—1,76 


0,04 |-1,751-—1,741-—173| —1,72|-1,71 | —1,70 | —1,68|-—1,67 | —1,66|—1,65 
0,06 |-—1,64|—1,64| —1,631 —1,621-—1,61|-—1,60|—1,59| —1,58 |-—1,57 | —1,57 
0,06 |—1,55| —1,55| —1,54| —1,53|-—1,52 |-—1,51 |—1,51|—1,50!-—1,49|—1,48 
0,07 |—1,48|—1,47|—1,46|—1, '45]-—1 45 —1,44 |—1,43|-—1,43 |—1,42 | —1,41 
0,08 |—1,41| —1,40/—1,39 | —1 '39|-—1,38 |-—1,37 |-1,37|-—1,36 |—1,35 |—1,35 
0,09 |—1,34/—1,33| —1,33| 1,32 |--1,32 | —1,31 |—1,30/-—1,30|—1,29 | —1,29 
0,10 |—1,28|—1,28|—1,27 126 —1,26 —1,25 | —1,25| —1,24| —1,24|—1,23 


0,11 —1,23| —1,221 —1,22|-—1,21 |—1,21 |-—1,20|—1,20]—1,191—1,19|—1,18 
0,12 |—1,18|—1,171-—1/17|--116|1-—1,16]-—1,15]-=1,15]-—1,14|-—1,14, —1,13 
0,13 |-—1/131-—1,12 |121 1,10 | -—1,10| —1,09|-—1,09 —1,09 
0,14 |-—1,08|-—1,081-—1,07 | 1,07 |-—1,06| —1,06|—1,05| —1,051—1,05| —1,04 
0,15 |-—1,04|--1,03|-—1,03 | —1,02|—1,02 | —1,02 | —1,011—1,01|-—1,01|-—1,00 
0,16 —0,99|—0,99| —0,99| —0,98|—0,98 | —0,97 | —0,97 | —0,97 | —0,96| —0,96 
0,17 |—0,95| —0,95| —0,95|--0,94 1 —0,94 | —0,93!—0,93| —0,93| —0,921 —0,92 
0,18 — 0,92! —0,91| —0,91|—0,90|—0,90 |—0,90 | —0,891—0,89 |—0,89 | —0,88 
0,19 |-0,88|—0,87| —0,87 | —0,87 |—0,86| 0,861 —0,86] —0,85| —0,85 | —0,85 
0,20 |-0,84|—0,84| —0,83| —0,83|—0.83 | —0,82| —0,82 | 0,82] —0,81 | —0,81 
0,21 —0,81 | —0,80| —0,801—0,80 | —0,79/-—0,79 | —0,79| —0,78 | —0,78 | —0,78 


а ———8—8————_——ж868———8—8——_——_ > 
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Продолжение табл. Г 


7 | 8 


—0,77 |—0,77 | —0,77 | —0,76| —0,76| —0,76| —0,75 |—0,75 |—0,75|—0,74 


—0,74 | —0,74| —0,73| —0,73 |—0,73|—0,72| —0,72|—0,721—0,71|—0,71 
—0,71 | —0,70| —0,70|—0,70| —0,69|—0,69 | —0,69| —0,68 | —0,68 | —0,68 
—0,67 | —0,67| —0,67 | —0,67 |—0,66|—0,66/ —0,66| 0,65 | —0,65| —0,65 


—0,64| —0,64|—-0,64| —0,63|--0,63|—0,63 | —0,63|-—0.62 | —0,62|-—-0,62 
—0,61|—0,61|-—0,61 |—0,60|-—0,60|-—-0,60 | —0,60|-—0,59| —0,59| —-0,59 
—0,58|—0,58|—0,58 | —0,57 |—0,571—0,57 | —0,57|--0,56| —0,56| —0,56 
—0'55| —0,55| —0,55| —0,54|--0,54|—0,54 |--0,54| —0,53| —0,53| —-0,53 
—0,53|-—0,52|--0,52|—-0,52|-—-0,51 | 0,51 |-—0,51 |-—-0,50|—0,50| -—-0,50 
—0,50|—0'.49|—0,49|-0,49\--0,48|—0'48| —0,48|—0,47 |-—0,47 |-—-0,47 
—0,47|—0,46|-—0,46|—0,46|—0,46|--0,45| —0,45|-—0,45| —0,45|--0,44 
—0,44| —0,44| —0,43|—-0,43|--0,43|-—0,43 | —0,43 |--0,42| 0,42 |-—-0'42 
—0,41 |--0,41|-—0,41|—0'40|-—0,40|-—-0,40| —0'40| 0,39] —0,39| 0,39 
0,39 |--0,38] —0,38| —0,38 | —0,37|-—0,37|—0,37|--0,37 | -—-0,36| —0,36 
—0,36|—0,36] —0,35|-—0,35 |—0,35 |—0:35| —0,34/—0,34/—0,34/—0;33 
—0,33|—_0,331—0,33|—0,391-—0,39|—0;321—0,391—0;31| —0,31 |-—0,31 
—0,31|--0,30|-—0,30|—0,30|-—0,30|-—0,29|—0,29|--0,29| —0,28|—0'28 
—0,28|—0,28|--0,27| —0,27|--0.27|—0,27| 0,26] --0,26 —0,26|--0'26 
—0,25|—0'25|-0'55| —0,25| 0,24 |—0,24|—0.24|-—0'24| —0'23|--0,23 
—0,23|—0,23|-—0,22| --0,22 |-—-0,22 |0,21 |--0.21|-—-0,21| —0,21 |--0,20 
—0,20|—0,20[—0,201-—0,19|—0,19(1—0,19|—0,19/—0.18|—0;18[—0,18 
0,18 |-—0,17|—0,17 |—0;,17 [—0,17|—0,16|—0,16|-—0,16|—0,16|-—0,15 
0,15 |—0,15 |—0,15 |—0;141—0;14 |-—0,14|—0,14/|—0,13|—0;13|—0;13 
0,13 |—0,191—0;191-—0;19 | —0,191—0,11 |—0;111—0,11 1—01 |0,10 
—0,10|—0,10|-—0,10|-—0,09| —0,09|--0,09 |-—0,09| —0,08 |—0,08|—0;08 
—0,08|—0,07|-0,07|-—0,07 |--0,07 |-—0;06|-—0,06| —0,06| —0,06|--005 
—0,05|-—0,05|-—0,05|-—0,04|--0,04 |--0,04|—-0,04| —0,03|-—0,03 |--0'03 
—0,03|—0,02|-—0'02|-—0'02|—0,02|--0,01 |-—0,01|-—0;01 |--0,01|--0,00 
40,001 --0,00|-+-0'01|--0,01 |--0,01|--0'01 |-+0'021 0,02 |-+-0'021--0'02 
0,031 0,03 0,03 4} 0,04| 0, | 


, р ‚03 0,04: 0,0 ; 04| 0,05| 0,05 
0,051 0,05] 0,06] 0,06] 0,06] 0,06] 0,07] 0,07| 0,07| 0,07 
0,08] 0,08] 0,08| 0.08] 0,09] 0,091 0,09] 0,09] 0,10) 0,10 
0,101 0,101 ОЦ 01 о оти 0,12| 0,127 0,121 0,12 
0,13} 0,13] 0,13] 0,131 0,14| 0,14] 0,14] 0,14} 0,151 0,15 
0,15| 0,15| 0,16] 0,16| 0,16) 016; 0,17| 0,17 0,17| 0,17 
0,18] 0,181 0,18} 0,18| 0,19] 0,191 0,191 0,18, 0,20| 0,20 
0,201 0,20] 0,211 0,21 0,21} 0,21! 0,22] 0,22] 0,22| 0,23 
0,231 0,231 0,231 0,24| 0,24] 0,24| 0,24] 0,25| 0.25] 0,25 
0,25] 0,261 0,26] 0,26] 0,26| 0,27| 0,27| 0,27] 0,27| 0,28 
0,28, 0,28] 0,281 0,29| 0,29| 0,29| 0,30] 0.30] 0,301 0,30 
0,311 0,31] 0,31 0,31| 0,321 0,32} 0,32| 0,32| 0,33; 0,33 
0,33] 0,33| 0,34] 0,34} 0,34| 0,35| 0,35| 0,35] 0,35 0,36 
0,36] 0,36] 0,36] 0,37] 0,37| 0,37] 0,37| 0,38] 0,38| 0,38 
0,39] 0,39| 0,39] 0,39| 0,40| 0,40| 0,40| 0,401 0,41| 0,41 
0,41| 0,42] 0,42] 0,42| 0,42| 0,43| 0,43] 0,43| 0,431 0,44 
0,44] 0,44: 0,45| 0,45| 0,45| 0,45| 0,46; 0,46| 0,46] 0,46 
0,47] 0,47, 0,47| 0,48| 0,48] 0,48; 0,48) 0,49} 0,491 0.49 
0,50] 0,50] 0,50] 0,50] 0,511 0,51 0,51| 0,52] 0,52| 0,52 
0,521 0,53] 0,53] 0,531 0,54] 0,54] 0,54] 0,54] 0.55| 0,55 
0,551 0,56] 0,56] 0,56] 0,57| 0,57| 0,57| 0,57; 0,58| 0,58 


Продолжение табл. ІХ 


В 
т 0 1 2 3 4 5 6 7 8 9 
0,72 0,58| 059| 0,59| 0,59| 0,59} 0,601 0,601 0,60; 0,611 0,61 
0,73 0,61] 0,62| 0,621 0,62; 0,63| 0,63| 0,63| 0,63| 0,64| 0,64 
0,74 0,64] 0,65] 0,65| 0,65| 0,66| 0,66| 0,66] 0,67 0,67| 0,67 
0,75 0,67] 0,68| 0,68| 0,68] 0,69; 0,69| 0,691 0,70| 0,70| 0,70 
0,76 0,711 0,711 0,71| 0,72| 0,72| 0,721 0,73] 0,73) 0,73] 0,74 
0,77 0,74] 0,74] 0,75| 0,751 0,75| 0,761 0,76| 0,76| 0,77| 0,77 
0,78 0,77| 0,78] 0,78] 0,78] 0,79] 0,79] 0,79] 0,80] 0,80| 0,80 
0,79 0,81] 0,81] 0,81] 0,82] 0,82] 0,82] 0,83] 0,83 0,83) 0,84 
0,80 0,841 0,85] 0,85] 0,85] 0,86] 0,86: 0,86] 0,87; 0,87; 0,87 
0,81 0,88] 0,88: 0,89] 0,89] 0,891 0,90] 0,90] 0,901 0,91] 0,91 
0,82 0,92] 0,92] 0,92] 0,93] 0,931 0,931 0,941 0,94] 0,95] 0,95 
0,83 0,95] 0,96] 0,96] 0,97] 0,97| 0,97| 0,98] 0,98] 0,99] 0,99 
0,84 0,99] 1,00] 1,00] 1,01] 1,01| 1,021 1,02] 1,02] 1,03] 1,03 
0,85 1,04] 1,04] 1,05] 1,05! 1,05] 1,06] 1,06] 1,07] 1,07| 1,08 
0,86 1,08] 1,09] 1,09] 1,09] 110] 1,101 1,11] БИ 12| 112 
0,87 1,13] 1,15} 1,40 1,14] 15| 15| 116] 1,161 1,17] 1,17 
0,88 1181 1,18] 119] 119| 1,20| 1,20] 121 1,21] 1,22] 122 
0,89 1,23] 1,23| 1,24! 1,24| 1,25| 1,25| 1,26: 1,26| 1,27| 1,28 
0,90 1,28| 1,29] 1,29} 1,301 1,301 1,31] 1,32| 1,32] 1,33} 1,33 
0,91 1,34| 1,35] 1,35] 1,36| 1,37| 1,38| 1,37| 1,391 1,39| 1,40 
0,92 ҺА 1,411 1,42] 1,43] 1,43] 1,44) 1,45] 145] 1,46] 1,47 
0,93 1,48] 1,481 1,491 1,50] 1,51} 1,51} 1,521 1,53) 1,54] 1,55 
0,94 1,55| 1,56| 1,57] 1,58| 1,59] 1,60] 1,61| 1,62| 1,631 1,64 
0,95 1,64| 1,65] 1,66] 1,67| 1,68| 1,70] 1,71| 1,72] 1,73| 1,74 
0,96 1,75] 1,76] 1,77| 1,79| 1,80] 1,81] 1,83 1,841 185] 1,87 
0,97 1,88] 1,90| 1,91| 1,93] 1,94| 1,96| 1,98| 2,00| 2,01} 2,03 
0,98 2,05] 2,07| 210| 2,12| 2,14| 2,17| 2,20| 2,23| 2,26] 2,29 
0,99 2,38] 2,37| 2,41| 2,46| 2,51| 2,58| 2,65| 2,75| 2,88| 3,09 
Таблица Х. Критические значения Х-критерия Ван-дер-Вардена 
П1—П2=0 или 1 п!-—П2=2 или 3 П1—П2=4 или 5 
Уровни значимости Уровии значимости Уровни значимости 
п а, % В а, Ф 
5 1 5 1 5 1 
8 2,40 — 2,30 — — — 
9 2,48 = 2,40 23, ЛЕ =: 
10 2,60 3.20 2,49 3,10 2,30 — 
1 2,72 3,40 258 3,40 2,40 — 
12 2,86 3,60 2,79 3,58 2,68 3,40 
13 2,96 3,71 2,91 3,64 2,78 3,50 
14 3,11 3,94 3,06 3,88 3,00 3,76 
15 3,24 4,07 3,19 4,05 3.06 3,88 
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п-—п2=0 или 1 


Уровни значимости 
% 


ита 


, 


3,39 4,26 
3,49 4,44 
3,63 4,60 
3,73 4,77 
3,86 4,94 
3,96 5,10 
4,08 5,26 
4,18 5,40 
4,29 5.55 
4,39 5,68 
4,50 5,83 
4,59 5,95 
4,68 6,09 
4,78 6,22 
4,88 6,35 
4,97 6,47 
5,07 6,60 
5,15 6,71 
5,25 6,84 
5,33 6,95 
5,42 7,06 
5.50 7,17 
5.59 7,28 
5,67 7,39 
5,75 7,50 
5,83 7,62 
5,91 7,72 
5,99 7,82 
6,04 7,93 
6,14 8,02 
6,21 8,13 
6,29 8.22 
6,36 8,32 
6,43 8,41 
6,50 8,51 
| 0,05 | 0,01 


п1-—По=2 или 3 


Уровни значимости 
% 


а, 


Продолжение табл. ї 


п: —И2=4 или 5 


Уровни значимости 
а, % 


3,28 4,12 
3,36 4,23 
3.53 4,50 
3,61 4,62 
3,78 4,85 
3,85 4,96 
4,01 5,17 
4,08 5,27 
4,23 5,48 
4,30 5,58 
4,44 5,76 
4,51 5,85 
4,64 6,03 
4,72 6,13 
4.84 6,30 
4,91 6,39 
5,03 6,55 
5,10 6,64 
521 6,79 
5,28 6,88 
5,38 7,02 
5,45 7,11 
5,55 7,25 
5,62 7,33 
5,72 7,47 
5,79 7,56 
5,88 7,69 
5,95 7,77 
6,04 7,90 
6,10 7,98 
6,19 8,10 
6,25 8,18 
6,34 8,29 
6,39 8,37 
6,48 8,48 
0,05 | 0,01 


“аблица ХІ. Критические значения И-критерия Уилкоксона (Манна — Уитни) 
(односторонний критерий, Р=0,01) 


т 
5 67891 11 12 13 14 15 16 17 18 19 20 п 
п? 

з ооо о 1 1 1 202 2 з 3 4 4 4 5 3 
4 тез 3 4 55 6 м 8 9 910 4 
5 1234 5 6 7 зв эю и 2 8 4 15 16 5 
6 з 46 7 в 91 19 м 15 16 18 19 20 22 6 
7 6 7 9 11 12 14 16 18 19 21 23 24 26 28 7 
8 9 11 13 15 17 20 22 24 26 28 30 32 34 8 
9 14 16 19 21 93 26 28 31 33 36 38 40 9 
10 19 22 24 27 30 33 36 38 4 44 47 10 
91 25 28 31 34 37 41| 44 47 50 53 11 
12 31 35 38 42 46 49 53 56 60 12 
13 39 43 47 51 55 59 63 67 13 
14 47 51 56 60 65 69 73 14 
15 56 61 66 70 75 80 15 
16 66 71 76 82 87 16 
17 77 82 88 94 17 
18 88 94 100 18 
19 101 107 19 
20 114 20 


Продолжение табл. ХІ (двусторонний критерий, Р==0,01) 


п? 

3456789101 1213 14 15 16 Ив 19 2) п 
т 
5 ооо 5 
б оо 12 6 
7 ооз 4 7 
8 012 467 8 
9 013 5 7 9и 9 
10 02 46 911316 10 
И 02 5 7 10 13 16 1921 п 
12 1 3 6 9 12 15 18 21 24 28 12 
13 1 4 7 10 1317 20 24 27 31 34 13 
14 1 4 7 11 15 18 22 26 30 34 38 42 14 
15 2 5 8 12 16 20 25 29 33 37 42 46 51 15 
16 2 5 9 13 18 22 27 31 36 41 46 50 55 60 16 
17 2 6 10 15 19 24 29 34 39 44 49 54 60 65 70 17 
18 26 и 16 21 26 31 37 42 47 53 59 64 70 75 77 81 18 
19 3 7 12 17 22 28 34 39 45 51 57 63 69 75 81 87 93 19 
25 3 8 13 18 24 30 36 42 48 54 60 67 73 79 86 92 99 105 29 
21 3 8 14 19 25 32 38 44 51 58 64 71 78 84 91 98 105 112 21 
22 4 9 14 21 27 34 40 47 54 61 68 75 82 89 97 104 111 118 22 
23 4 9 15 22 29 36 43 50 57 64 72 79 87 94 102 109 117 125 23 
94 4 10 16 23 30 37 45 52 60 68 76 83 91 99 107 115 123 131 24 
25 5 10 17 24 32 39 47 55 63 71 79 88 96 104 113 121 129 138 25 


Таблица ХИ. Критические значения г-критерия знаков при разных уровня. 
значимости а и объеме выборки п 


а, $ а, % а, $ а, % 


< 
> 
217 
= 
е 
[217 
ЕА 


Р | 0,05 | 0,01 | — | 0,05 | 0,01 | — | 0,05 | | — | 0,05 | 0,01 
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"аблица ХШ. Критические значения парного Т-критерия Уилкоксона (одно- 
сторонний критерий) 


Уровни зиачимости Уровии зиачимости 
Число пар- а % Число пар- а, 
иых наблю- ти мт ных наблю- 
дений п деиий п 
5 1 5 1 
5 0 — 14 25 16 
6 2 0 15 30 19 
7 3 0 16 35 23 
8 5 1 17 41 28 
9 8 З 18 47 33 
10 10 5 19 53 38 
ув 13 7 20 60 42 
12 17 10 21 67 50 
13 21 12 22 74 56 
Р | 0,05 | 0,01 — | 0,05 м | || 0,01 
Продолжение таблицы ХІІІ. (двусторонний критерий) 
Уровии зиачимости Уровии значимости 
Число пар- а, % Число пар- а, % 
иых наблю- и ых наблю- 
деиий п деиий л 
5 и Е 1 5 1 
6 1 — 16 31 21 
7 3 — 17 36 24 
8 5 1 18 41 29 
9 7 3 19 47 33 
10 9 4 20 53 39 
11 12 6 21 60 44 
12 15 8 22 67 50 
13 18 1 23 74 56 
14 22 14 24 82 62 
15 26 17 25 90 69 
Р (ов оа | Гов [аш 0,05 | 0,01 — | 0,05 0,01 


Примечание. Для п>>25 критические значення Т-критерия можно опре- 
делить по формуле 


т п(п+4+ 1) п(п + 1) (21 + 1) 
Ета Е > 


‘де п число парных наблюдений; # зависит от принятого уровня значимо- 
тн, Т. е, ѓо,ов == 1,96 и їо,о1==2,58, 
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Таблица ХІУ. Критические значения коэффициента асимметрии Аз 


Уровии зиачимости Уровин значимости 
а, % а, % 
Объем вы- ЕЕ АННЫ, Объем вы- 
борки л борки л 

5 1 5 1 
25 0,711 1,061 250 0,251 0,360 
30 0,661 0,982 300 0,230 0,329 
35 0,621 0,921 350 0,218 0,305 
40 0,587 0,869 400 0,200 0,285 
45 0,558 0,825 450 0,188 0,269 
50 0,533 0,787 500 0,179 0,255 
60 0,492 0,723 550 0,171 0,243 
70 0,459 0,673 600 0,163 0,233 
80 0,432 0,631 650 0,157 0,224 
90 0,409 0,596 700 0,151 0,215 
100 0,389 0,567 750 0,146 0,208 
125 0,350 0,508 800 0,142 0,202 
150 0,321 0,464 850 0,138 0,196 
175 0,298 0,430 900 0,134 0,190 
200 0,280 0,403 950 0,130 0,185 
1000 0,127 0,180 

Р | 0,05 0,01 | — | 0,05 0,01 


г 
Таблица ХУ. Критические значения коэффициента эксцесса Ех 


Уровни значимости а, % 


10 | 5 | 1 


Объем выборки л 


11 0,890 0,907 0,936 
16 0,873 0,888 0,914 
21 0,863 0,877 0,900 
26 0,857 0,869 0,890 
31 0,851 0,863 0,883 
36 0,847 0,858 0,877 
41 0,844 0,854 0,879 
46 0,841 0,851 0,868 
51 0,839 0,848 0,865 
61 0,835 0,843 0,859 
71 0,832 0,840 0,855 
81 0,830 0,838 0,852 
91 0,828 0,835 0,848 

101 0,826 0,834 0,846 

201 0,818 0,823 0,832 

301 0,814 0,818 0,826 

401 0,812 0,816 0,822 

501 0,810 0,814 0,820 
Р 0,10 0,05 0,01 


“аблица ХУІ. Критические значения величины нормированного отклонения 
ри оценке сомнительных вариант с учетом объема выборки п и уровней 
значимости а 


а, % а, % а, % 
п д д 
5 1 5 1 5 1 
4 1,71 1,73 13 2,56 2,81 23 2,84 3,16 
5 1,92 1,97 14 2,60 2,86 24 2,86 3,18 
(9 2,07 2,16 15 2,64 2,90 25 2,88 3,20 
7 2,18 2,31 16 2,67 2,95 26 2,90 3,22 
8 2,27 2,43 17 2,70 2,98 27 2,91 3,24 
9 2,35 2,53 18 2,73 3,02 28 2,93 3,26 
10 2,41 2,62 19 2,75 3,05 29 2,94 3,28 
11 2,47 2,69 20 2,78 3,08 30 2,96 3,29 
12 2,52 2,75 21 2,80 3,11 
Р | 0,05 | 0,01 | — | 0,05 | 0,01 | — | 0,05 | 0,01 
Хо — Хі 
Таблица ХҮП. Критические значения критерия ћ == 
Ха-177 21 
Уровни зиачи- Уровии значи- Уровни значи- 
мости а, % мости а, % мости а, % 
п п д 
5 1 5 1 5 1 


10 0,41 0,53 19 0,31 0,40 28 0,27 0,35 
1 0,39 0,50 20 0,30 0,39 29 0,26 0,34 

12 0,38 0,48 21 0,30 0,38 30 0,26 0,34 
о Е ЗЕЕЕЕЕАЛЕ ИЕНЕН ЕНЕНЕЕЕДОНАИННЕНЕБЫОННЕДЬЕЕСЕА 
Р | 0,05 | 0,01 | = | 0,05 | 0,01 | — | 0,05 | 0,01 


А 
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Таблица ХҮШ. Критические значения критерия Ь == 


| Уровии значн- 


Уровни зиачи- 


Хп Хп-1 
Хд — ^2 


Уровии зиачи 


мости а, % мости а, % мости а, % 

а п п 
| 5 | 1 5 1 5 1 

4 0,96 0,99 13 0,41 0,52 22 0,32 0,41 
5 0,81 0,92 14 0,40 0,50 23 0,31 0,41 
6 0,69 0,80 15 0,38 0,49 24 0,31 0,40 
7 0,61 0,74 16 0,37 0,47 25 0,30 0,39 
8 0,55 0,68 17 0,36 0,46 | 26 0,30 0,39 
9 0,51 0,64 18 0,35 0,45 | 27 0,30 0,38 
10 0,48 0,60 19 0,34 0,44 | 28 0,29 0,38 
и 0,45 0,57 20 0,33 0,43 29 0,29 0,37 
12 0,43 0,54 21 0,33 0,42 | 30 0,28 0,37 
Р | 0,05 | 0,01 | — | 0,05 | 0,01 | Е | 0,05 | 0,01 


п;=3 п;=4 п;=3 

п, а, % а, % п; а, % 
5 1 5 1 5 | 1 

2 6,0 9 6,22 8,67 
3 6,0 7,4 9,0 10 6,20 9,60 
4 6,5 8,0 7,8 9,6 И 6,54 9,46 
5 6,4 8,4 7,8 9,96 12 6,17 9,50 
6 7,0 9,0 7,6 10,20 13 6,0 9,38 
7 7,14 8,86 7,8 10,37 14 6,14 9,00 
8 6,25 9,00 7,65 10,35 15 6,40 8,93 
р 0,05 0,01 | 0,05 | 0,01 | | 0,05 | 0,01 


{2 


Таблица ХІХ, Критические значения критерия х?к Фридмана 


Примечание. пз — число выборок, 


Таблица ХХ. Критические значения критерия Н Краскелла — Уоллиса 


ча ~ о1о О г + О Ф с СЧ СЧ 


Уровии значи- 
мости а, % 


сч сэ > с о ао ч осоо соо 


| 


ЧМО ОМО О О < 2 О1О О оао О «О «О 


лз 


и чиа ао О < < аа ОАО ао О (О 


п? 


ЕУ со со су со СО СО «і 9 «і Чи і ЧАО ЗО ао (О 


сә 1 «н СЧ. СЧ < слао со 
1 15% 955955894095 


Уровни значи- 
мости а, % 


Са С н) ОС) «на О «нао «О ао О су ЗФ 


СЯ СЧС СЧ су сэ со со Ч < ЧМ о С Сэ СО су 


т 


9 сч сч Сі СІС СІ СЇ су СЧ СЧ С СЧ сч С сэ СЭ су 


Уровни значимости а, % 


1 


Таблица ХХІ. Критические значения коэффициента корреляции гху 
Уровни зиачимости а, % 
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со со Со со со СО СЧ СЧ СЧ СЧ СЧ СҶ СЧ 4 ч а О О ФО 


Таблица ХХІІ. Значения 2, соответствующие значениям выборочного коэф 


Я 


фициента корреляции Гху 


Сотые доли коэффициента корреляции 


2 


0,0 [0,000 | 0,010 | 0,020 
оі [0,100 [0,110 | 0,121 
02 [0:203 | 0,213 | 0,224 
0,3 [0,310 | 0,391 | 0,382 
04 10.494 | 0,436 | 0,448 
0,5 [0,549 | 0563 | 0,576 
0,6 |0.693 | 0,709 | 0,725 
07 |0867 | 0,887 | 0,908 
08 |1/099 |127 | 1,157 
09 {1,472 | 1,528 | 1,589 
0,99 |9;647 | 2.700 | 2,759 


5 


0,050 
0,151 
0,255 
0,365 
0,485 
0,618 
0,775 
0,973 
1,256 
1,832 
2,995 


| 


6 


0,060 
0,161 
0,266 
0,377 
0,497 
0,633 
0,793 
0,996 
1,293 
1,946 
3,106 


Таблица ХХИ!. Критические значения коэффициента корреляции рангов прі 
различных уровнях значимости а и объемах выборки п 


а, % а, % а, % 
& 5 1 " 5 1 Ы 5 1 
5 0,94 — 17 0,48 0,62 29 0,37 0,48 
6 0,85 — 18 0,47 0,60 30 0,36 0,47 
7 0,78 0,94 19 0,46 0,58 31 0,36 0,46 
8 0,72 0,88 20 0,45 0,57 32 0,36 0,45 
9 0,68 0,83 21 0,44 0,56 33 0,34 0,45 
10 0,64 0,79 22 0,43 0,54 34 0,34 0,44 
11 0,61 0,76 23 0,42 0,53 35 0.33 0,43 
12 0,58 0,73 24 0,41 0,52 36 0,33 0,43 
13 0,56 0,70 25 0,40 0,51 37 0,33 0,42 
14 0,54 0,68 26 0,39 0,50 38 0,32 0,41 
15 0,52 0,66 27 0,38 0,49 39 0,32 0,41 
16 0,50 0,64 28 0,38 0,48 40 0,31 0,40 
Р | 0,05 | 0,01 | — | 0,05 | 0,01 | — | 0,05 | 0,01 
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соответствующие 5%-ному уровню 


начимости а и числу групп (градаций), входящих в дисперсионный комп- 


“аблица ХХУГ. Значения величины 0), 


лекс 


Е ЕЕ НИНЕ ЧЕРИ 


я 90 < СЇ © 00 г «О оао < < со СО СЧ СЧ © >< 


Е а Е р еи еа Ае а о у аана А зб 


п 


10 
5 
2 
9 
7 
6 
5 
4 
3 
3 
2 
2 
1 
1 
0 
0 
9 
8 
7 
‚7 
‚6 


Число градаций а 
7 
9 
5 
4 
2 
1 
0 
0 
9 
8 
8 
7 
7 
7 
6 
6 
5 
5 
4 
З 
2 


Числа 
степени 
свободы 

ГА 
1 
1 
1 
1 
1 
1 
1 
1 
20 
24 
30 
40 
60 
120 
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— — непрерывиая 82 Уровень зиачнмости 107, 112 

Случайиых чисел таблица 98 Условного иуля способ 56 
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— невозможные 
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— генеральная 96 — Ф-преобразоваиие 123 


- 


Форма связи 235 


Скользящей средией способ 263 Функция 254 


Согласия критерий 138 


НЫ а Пирсона 247 — днскриминантиая 315, 317 
— — Чупрова 247 
Спирмена — Кербера способ 135 Хн-квадрат критерий 138 


Средиее квадратическое отклонение 13, 49, ХОТеллнига Т’-критерий 313 
1 


— — — частиое (парциальное, остаточное) Частость 26 
299 Частоты, разноска по классам 31 
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— (Наивероятнейшее) число ожидаемого Шарлье формула 92 
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Ястремского Ј-крнтерий 145 


